一篇学会Pytorch数据集下载

Posted Rgylin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一篇学会Pytorch数据集下载相关的知识,希望对你有一定的参考价值。

文章目录


前言

数据集是我们在训练模型中经常用到的,那我们该如何下载并进行使用它呢


数据来源

打开pytorch官网

发现有很多:音频,视觉,文字之类的
以视觉为例打开torchvision

发现好多数据集已经为我们列出来了.COCO数据集等等

以第一个数据集为例,点开后发现其用法都在上面了,我们只需要看懂会用即可

代码如下(示例):


## 下载数据

> 当我们选择好一个数据集时,(以CIFAR10为例),我们该如何下载使用呢.

导入相关的包,在pycharm中按ctrl p 会有提示

```python
import torchvision
from torchvision
trainset = torchvision.datasets.CIFAR10(root='./data',train=True,download=True)
  • root是下载到的文件夹
  • train 是否是训练数据, 否则就是测试数据
  • download是否要进行下载


按照提示输入参数即可
其中transforms是图像所进行的操作

可以看到有很多操作的类,这里我们以ToTensor 来看按住ctrl 点进去即可看见源码


大概意思就是将一个PIL或者是numpy类型转换成 tensor数据类型

我们继续来看 数据对象

在pycharm console种可以看到对象的各个属性对应

而对应的索引值是一个图片和一个对应的索引

我们就可以用image对象接受并进行显示

import torchvision
from torchvision import transforms
import  torch.utils.tensorboard.summary
trainset = torchvision.datasets.CIFAR10(root='./data',train=True,download=True)
print(trainset.classes)
image,index = trainset[1]

image.show()
print(trainset.classes[index])

transforms联用

那我们接下来就用tansforms对这些数据集进行,操作

以Totensor为例


发现已经转成了tensor数据类型

那我们将其数据记录到tensorboard种,进行显示.

import torchvision
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
write= SummaryWriter("rgylin_data")
daset_transform= transforms.Compose([transforms.ToTensor()])
trainset = torchvision.datasets.CIFAR10(root='./data',transform=daset_transform,train=True,download=True)
for i in range(15):
    img,index= trainset[i]
    write.add_image("rgylin_data",img,i)
    
write.close()

我们点金add_image看看源码,
发现只能是tensor数据类型,那正好了

import torchvision
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
write= SummaryWriter("rgylin_data")
daset_transform= transforms.Compose([transforms.ToTensor()])
trainset = torchvision.datasets.CIFAR10(root='./data',transform=daset_transform,train=True,download=True)
for i in range(15):
    img,index= trainset[i]
    write.add_image("rgylin_data",img,i)

write.close()




tensorboard显示一下,

控制台输入tensorboard --logdir=C:\\Users\\ASUS\\Desktop\\rgylin_data
就可以了
最终得到

总结

有很多生函数,利用控制台看变量,还有就是看函数的源码注释。官方都给的很详细

以上是关于一篇学会Pytorch数据集下载的主要内容,如果未能解决你的问题,请参考以下文章

一篇学会Pytorch数据集下载

PyCharm-MNIST手写数字的识别

[Pytorch数据集下载] 下载MNIST数据缓慢的方案

pytorch人脸识别——自己制作数据集

Pytorch定义并训练自己的数字数据集

Pytorch定义并训练自己的数字数据集