pytorch构建自己的数据集

Posted yanxingang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pytorch构建自己的数据集相关的知识,希望对你有一定的参考价值。

现在需要在json文件里面读取图片的URL和label,这里面可能会出现某些URL地址无效的情况。

python读取json文件

此处只需要将json文件里面的内容读取出来就可以了

with open("json_path",r) ad load_f:
    load_dict = json.load(load_f)

json_path是json文件的地址,json文件里面的内容读取到load_dict变量中,变量类型为字典类型。

python通过URL打开图片

通过skimage获取URL图片是简单的方式。

from skimage import io
image = io.imread(img_src) # img_src是图片的URL
io.imshow(image)
io.show()

pytorch构建自己的数据集

pytorch中文网中有比较好的讲解: https://ptorch.com/news/215.html

加载图片预处理以及可视化见: https://oldpan.me/archives/pytorch-transforms-opencv-scikit-image

定义自己的数据集使用类 torch.utils.data.Dataset这个类,这个类中有三个关键的默认成员函数,__init__,__len__,__getitem__。

__init__类实例化应用,所以参数项里面最好有数据集的path,或者是数据以及标签保存的json、csv文件,在__init__函数里面对json、csv文件进行解析。

__len__需要返回images的数量。

__getitem__中要返回image和相对应的label,要注意的是此处参数有一个index,指的返回的是哪个image和label。

以上是关于pytorch构建自己的数据集的主要内容,如果未能解决你的问题,请参考以下文章

pytorch构建自己的数据集

pytorch 加载数据集

在PyTorch中构建高效的自定义数据集

使用faster-rcnn.pytorch训练自己数据集

手撕Resnet卷积神经网络-pytorch-详细注释版(可以直接替换自己数据集)-直接放置自己的数据集就能直接跑。跑的代码有问题的可以在评论区指出,看到了会回复。训练代码和预测代码均有。

YOLOv7 pytorch