10分钟快速入门PyTorch

Posted 机器学习算法与自然语言处理

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了10分钟快速入门PyTorch相关的知识,希望对你有一定的参考价值。

10分钟快速入门PyTorch(1)




上一篇教程我们基本的介绍了pytorch里面的操作单元,Tensor,以及计算图中的操作单位Variable,相信大家都已经熟悉了,下面这一部分我们就从两个最基本的机器学习,线性回归以及logistic回归来开始建立我们的计算图进行运算。


由于这个系列文章主要是将pytorch教程的,所以每个算法的太多数学背景以及推导过程就不再细讲了,需要的同学可以自己找相应的教材去了解,什么统计学习方法,prml,周志华的西瓜书以及机器学习实战都可以了解到相应内容。

1
  线性回归


对于线性回归,相信大家都很熟悉了,各种机器学习的书第一个要讲的内容必定有线性回归,这里简单的回顾一下什么是简单的一元线性回归。即给出一系列的点,找一条直线,使得这条直线与这些点的距离之和最小。


上面这张图就简单地描绘出了线性回归的基本原理,下面我们重点讲讲如何用pytorch写一个简单的线性回归。


code

data


首先我们需要给出一系列的点作为线性回归的数据,使用numpy来存储这些点。


10分钟快速入门PyTorch(1)


显示出来就是这个样子


10分钟快速入门PyTorch(1)

还记得pytorch里面的基本处理单元吗?Tensor,我们需要将numpy转换成Tensor,如果你还记得上一节的内容,那么你就一定记得这个函数,torch.from_numpy()


10分钟快速入门PyTorch(1)


这样我们的数据就转换成了Tensor。

model


上一节讲了基本的模型框架,按照这个框架就可以写出一个线性回归模型了


10分钟快速入门PyTorch(1)


这里的nn.Linear表示的是 y=w*x+b,里面的两个参数都是1,表示的是x是1维,y也是1维。当然这里是可以根据你想要的输入输出维度来更改的,之前使用的别的框架的同学应该很熟悉。

然后需要定义loss和optimizer,就是误差和优化函数


10分钟快速入门PyTorch(1)


这里使用的是最小二乘loss,之后我们做分类问题更多的使用的是cross entropy loss,交叉熵。优化函数使用的是随机梯度下降,注意需要将model的参数model.parameters()传进去让这个函数知道他要优化的参数是那些。

train


接着开始训练

10分钟快速入门PyTorch(1)


第一个循环表示每个epoch,接着开始前向传播,然后计算loss,然后反向传播,接着优化参数,特别注意的是在每次反向传播的时候需要将参数的梯度归零,即


optimzier.zero_grad()


validation


训练完成之后我们就可以开始测试模型了


model.eval()predict = model(Variable(x_train))predict = predict.data.numpy()


特别注意的是需要用 model.eval(),让model变成测试模式,这主要是对dropout和batch normalization的操作在训练和测试的时候是不一样的

最后可以得到这个结果


10分钟快速入门PyTorch(1)

以及loss的结果


ok,在这篇文章中我们使用pytorch实现了简单的线性回归模型,掌握了pytorch的一些基本操作,下一节我们将使用logistic回归对MNIST手写字体数据集做识别。

本文代码已经上传到了github

欢迎查看我的知乎专栏,深度炼丹

欢迎访问我的博客



全是通俗易懂的硬货!只需置顶~欢迎关注交流~





以上是关于10分钟快速入门PyTorch的主要内容,如果未能解决你的问题,请参考以下文章

深度学习之30分钟快速入门PyTorch(附学习资源推荐)

PyTorch深度学习60分钟快速入门 Part2:Autograd自动化微分

PyTorch深度学习60分钟快速入门 Part1:PyTorch是什么?

PyTorch深度学习60分钟快速入门 Part0:系列介绍

PyTorch深度学习60分钟快速入门 Part3:神经网络

干货|10分钟入门PyTorch~附源码