PyTorch学习CNN手写体识别

Posted My heart will go ~~

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PyTorch学习CNN手写体识别相关的知识,希望对你有一定的参考价值。

本节将介绍利用CNN进行手写体识别
首先呢,我们需要下载数据来进行训练。下载的代码如下:
注意:数据集下载一次就好,

DOWNLOAD_MNIST = True

train_data=torchvision.datasets.MNIST(#下载数据的代码
    root='./mnist',
    train=True,
    transform=torchvision.transforms.ToTensor(),  #(网上数据改为tensor),0-1之间,并复制到train_data中
    download=DOWNLOAD_MNIST#没有下载就=true,下载了就用false
    )

然后我们简单介绍一下卷及神经网络CNN的结构:

整体流程是:卷积(Conv2d) -> 激励函数(ReLU) -> 池化, 向下采样 (MaxPooling) -> 再卷积(Conv2d) -> 再激励函数(ReLU) -> 再池化, 向下采样 (MaxPooling) -> 展平多维的卷积成的特征图 -> 接入全连接层 (Linear) -> 输出。
全部代码如下:(给出了大部分的详细注释)

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.utils.data as Data
import torchvision
import matplotlib.pyplot as plt

EPOCH=1  #训练整批数据的次数
BATCH_SIZE = 50#批训练的数据个数
LR = 0.001     # 学习率
DOWNLOAD_MNIST = False  


train_data=torchvision.datasets.MNIST(#下载数据的代码
    root='./mnist',
    train=True,
    transform=torchvision.transforms.ToTensor(),  #(网上数据改为tensor),0-1之间,并复制到train_data中
    download=DOWNLOAD_MNIST#没有下载就=true,下载了就用false
    )
    
    #plt测试一下下载的照片
# print(train_data.train_data.size())
# print(train_data.train_labels.size())
# plt.imshow(train_data.train_data[0].numpy(),cmap='gray')#呈现出第一张图片
# plt.title('%i'%train_data.train_labels[0])
# plt.show()

#批训练(50,1,28*28)
train_loader=Data.DataLoader(dataset=train_data,batch_size=BATCH_SIZE,shuffle=True)

#测试集,train说明不是traindata,是testdata
test_data=torchvision.datasets.MNIST(root='./mnist/',train=False)

# 为了节约时间, 我们测试时只测试前2000个
test_x = Variable(torch.unsqueeze(test_data.test_data, dim=1),volatile=True).type(torch.FloatTensor)[:2000]/255.   
test_y = test_data.test_labels[:2000]


#建立CNN网络
class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        self.conv1=nn.Sequential(#卷积层1,包括以下三个内容
            nn.Conv2d(#卷基层,过滤器。
                in_channels=1,#图片的高度、层数。(因为输入的是二维图片,所以高度是1)
                out_channels=16,#16个filter的个数,同时进行扫描。输出的高度
                kernel_size=5,#kernel的宽、高都是5,5*5的扫描区域
                stride=1,#步长
                padding=2,#像素旁边一圈加上0的数据
                #如果 stride=1,padding=(kernel_size-1)/2=(5-1)/2=2
                ),
            nn.ReLU(),#激活函数,加了一层卷积层
            nn.MaxPool2d(kernel_size=2),#池化层,筛选重要的部分
            )
        self.conv2=nn.Sequential(#卷积层2
            nn.Conv2d(16,32,5,1,2),
            nn.ReLU(),#激活函数,加了一层卷积层
            nn.MaxPool2d(2),#池化层,筛选重要的部分
        )
        self.out=nn.Linear(32*7*7,10)#
        
    def forward(self,x):#展平的过程
        x=self.conv1(x)
        x=self.conv2(x)            #(batch,32,7,7)
        x=x.view(x.size(0),-1)     #(batch,32*7*7)
        output=self.out(x)
        return output

cnn=CNN()

optimizer = torch.optim.Adam(cnn.parameters(), lr=LR)   # optimize all cnn parameters
loss_func = nn.CrossEntropyLoss() 

#训练过程
for epoch in range(EPOCH):
    for step, (x, y) in enumerate(train_loader):   # 分配 batch data, normalize x when iterate train_loader
        b_x=Variable(x)
        b_y=Variable(y)

        output = cnn(b_x)               # cnn output
        loss = loss_func(output, b_y)   # cross entropy loss
        optimizer.zero_grad()           # clear gradients for this training step
        loss.backward()                 # backpropagation, compute gradients
        optimizer.step()                # apply gradients


        if step%50==0:
            test_output=cnn(test_x)
            pred_y=torch.max(test_output,1)[1].data.squeeze()
            accuracy=sum(pred_y==test_y)/test_y.size(0)

    
        

#最后取10组数据检查一下预测值到底对不对
test_output = cnn(test_x[:10])
pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze()
print(pred_y, 'prediction number')
print(test_y[:10].numpy(), 'real number')    

以上是关于PyTorch学习CNN手写体识别的主要内容,如果未能解决你的问题,请参考以下文章

全网最详细最好懂 PyTorch CNN案例分析 识别手写数字

AI常用框架和工具丨13. PyTorch实现基于CNN的手写数字识别

AI常用框架和工具丨13. PyTorch实现基于CNN的手写数字识别

AI常用框架和工具丨13. PyTorch实现基于CNN的手写数字识别

利用pytorch CNN手写字母识别神经网络模型识别多手写字母(A-Z)

PyTorch实现用CNN识别手写数字