Python 制作Pascal VOC数据集

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 制作Pascal VOC数据集相关的知识,希望对你有一定的参考价值。

参考技术A 下图是 Pascal VOC 数据集格式。
1、 Annotations 目录是存放 xml 文件;
2、 ImageSets 目录是存放 txt 文件,主要是测试集、训练集、验证集等文件名称的集合;
3、 JPEGImages 目录是存放图片文件( jpg );

1、从 Annotations 目录下读取 xml 目录;
2、把 xml 目录,随机重置一下,这样在训练的时候,各个分类是随机读取,不会出现某一个分类聚集读取,从而影响训练效果。当然,你也可以在训练的时候选择随机重置,道理是一样的;
3、创建将要写入的 txt 文件。这里示范了训练集、验证集,其他的可自行添加;
4、读取目录文件,通过前缀判断,写入 txt 文件。

有时候不需要指定数据集,只是从一个大的原始数据集中,随机选取一部分当中训练集、一部分当作验证集、一部分当作测试集。

以上是关于Python 制作Pascal VOC数据集的主要内容,如果未能解决你的问题,请参考以下文章

Detection物体识别-制作PASCAL VOC数据集

python pascal voc 2012数据集

python 用于PASCAL VOC数据集的颜色映射函数的Python实现。

PASCAL-VOC2012数据集(vocdevkitVocbenchmark_release)详细介绍

PASCAL-VOC2012数据集(vocdevkitVocbenchmark_release)详细介绍

Pascal VOC & COCO数据集介绍及相互转换