Junhao Zhou的博客

数据增强 Data Augumentation

Thu, 19 Mar 2026 20:52:12 +0000

数据增强是对数据进行不同的变化去生成同一张图片但是不同版本的样本 ```python import torchvision.transforms as transform data_transform = { 'train': transform.Compose([ transform.Resize([128,128]), transform.RandomRotation(45), #随机旋转（-45 - 45度） transform.CenterCrop(64), #从中心开始裁剪 transform.RandomHorizontalFlip(p=0.5), #水平翻转，选择一个概率 transform.RandomVerticalFlip(p=0.5), #垂直翻转，选择一个概率 transform.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1), #亮度，对比度，饱和度，色相 transform.RandomGrayscale(p=0.025), #概率转换为灰度 transform.ToTensor(), transform.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) #均值，标准差 ]), 'valid': transform.Compose([ transform.Resize([64,64]), transform.ToTensor(), transform.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) } ```。

视觉神经网络 Pytorch CNN NN

Wed, 11 Mar 2026 04:40:54 +0000

# 数据处理 ```python import torch from torchvision import datasets, transforms import numpy as np from torch.utils.data import DataLoader #用 MNIST 内置数据集 input_size = 28 #图片尺寸 num_classes = 10 #类别数量 num_epoch = 3 #训练轮数 batch_size = 64 #每批图片数量 device= 'cuda' if torch.cuda.is_available() else 'cpu' print(device) train_datasets = datasets.MNIST( #下载加载训练集 root = './data', train = True, download = True, transform = transforms.ToTensor() ) test_datasets = datasets.MNIST( #下载加载测试集 root = './data', train = False, download = True, transform = transforms.ToTensor() ) train_dataloader = DataLoader( #每次取一个batch dataset=train_datasets, batch_size=64, shuffle=True ) test_dataloader = DataLoader( #每次取一个batch dataset=test_datasets, batch_size=64, shuffle=True ) ``` # CNN模型框架 ```python class CNN(nn.Module): def __init__(self,num_classes): super(CNN,self).__init__() self.conv1 = nn.Sequential( #input: 1*28*28 nn.Conv2d( in_channels = 1, out_channels = 64, kernel_size = 3, stride = 1, padding = 1), # if want same width and length of this image after Conv2d, padding=(kernel_size-1)/2 if stride=1 #output: 64*28*28 nn.ReLU(), nn.MaxPool2d(kernel_size=2) #output after maxpool: 64*14*14 ) self.conv2 = nn.Sequential( nn.Conv2d(64,128,3,1,1), #input: 64*14*14 nn.ReLU(), #output: 128*14*14 nn.MaxPool2d(kernel_size=2) #output after maxpool: 128*7*7 ) self.conv3 = nn.Sequential( nn.Conv2d(128,256,3,1,1), #input: 128*7*7 nn.ReLU(), #output: 256*7*7 nn.MaxPool2d(kernel_size=2) #output after maxpool: 256*3*3 ) self.flatten = nn.Sequential( nn.Flatten(), nn.Linear(256*3*3, num_classes) ) def forward(self,x): x = self.conv1(x) x = self.conv2(x) x = self.conv3(x) x = self.flatten(x) return x ``` # 卷积大小计算公式 Padding = (kernel_size - 1) / 2 时，卷积不改变图片大小（stride = 1） Max_pool2d(kernel_size = 2) 尺寸减半 128*14*14 -> 128*7*7 # 模型实例化，损失和优化器 ```python model = CNN(num_classes).to(device) Loss = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=0.001) ``` # 训练循环 ```python for epoch in range(num_epoch): #训练几轮，epoch=3就是训练全部的数据集3次 print('开始训练') model.train() #训练模式 train_loss = 0 #初始化损失 for image, label in train_dataloader: #每次从数据集中取出一个图片和他的标签 image, label = image.to(device), label.to(device) #放进GPU optimizer.zero_grad() #清空上次训练的梯度 output = model(image) #得到这张图片的预测结果 loss = criterion(output, label) #计算预测结果和真实结果的损失 loss.backward() #根据损失，反向计算每个参数应该怎么调整 optimizer.step() #按照上一步计算的结果，真正去更新模型的参数 train_loss += loss.item() #把tensor转为数字 print('开始验证') model.eval() with torch.no_grad(): # 不计算梯度，节省内存，验证时不需要更新参数 correct = 0 # 初始化正确数量为0 for image, label in test_dataloader: # 每次从测试集取出一批图片和标签 image, label = image.to(device), label.to(device) output = model(image) # 得到模型预测结果（10个类别的得分 correct += (output.argmax(1) == label).sum().item() # 取得分最高的类别和真实标签对比，统计正确数量并累加 print(f'Epoch {epoch+1}/{num_epoch} | ' f'训练损失: {train_loss/len(train_dataloader):.2f} | ' f'准确值: {100.*correct/len(test_dataloader.dataset):.2f}%') ``` 。

机器学习神经网络的基本架构

Mon, 09 Mar 2026 23:57:35 +0000

## 1.数据获取 ## 2.特征工具 ## 3.建立模型 ## 4.评估与应用 # K-近邻 1.计算已知点与其他所有点的距离 2.按照距离排序 3.找到与当前点最近的k个点 4.确定前k个点属于各个类型的概率 5.将前k个点出现频率最高的点作为当前点的预测分类 # 损失函数（Loss）总损失 = 数据损失 + lambda正则化 lambda越大意味着惩罚力度越大，对模型复杂度容忍度降低，模型会变得更平滑，不纠结异常点，但是容易欠拟合 lambda越小意味着惩罚力度越小，模型会把训练集的错误降为0，模型会变得扭曲复杂，但是容易过拟合 # 回归问题： MSE, MAE用于回归训练（预测连续数值) # 分类问题： Binary Cross entropy用于二分类问题 Category Cross entropy用于多分类问题 # 前向传播： L=-logP(x), L越大，正确概率越小 # 神经元在复杂任务上用太少会欠拟合在简单任务上用太多会过拟合 # 激活函数 ## CNN 卷积神经网络输入层卷积层池化层全连接层 # 数据预处理初始化权重矩阵 W= 0.01 * np.random.randn(Depth, Height) # 卷积结果计算公式长度H2 = (H1 - Fh + 2P) / S + 1 宽度W2 = (W1 - Fw + 2P) / S + 1 # 权重参数 # Resnet 残差网络。