labelme使用labelme2voc.py忽略部分标签生成VOC/coco类型数据集(Ignore a label in json file)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了labelme使用labelme2voc.py忽略部分标签生成VOC/coco类型数据集(Ignore a label in json file)相关的知识,希望对你有一定的参考价值。
一:背景和问题描述
这是一个比较小众,且查找全网未有答案的问题。
在使用labelme标注数据之后,生成了json文件。在利用json文件生成可用于训练分割模型的voc或者coco数据集时,可以使用labelme中自带的示例文件labelme2voc.py,如下
转换时忽视指定的标签,如何做呢。
GitHub中有人提出了这样的问题,但是没有详细的解决办法,如下,
问题详情:
github见https://github.com/wkentaro/labelme/discussions/1097
Hi, I did what you say but got an error
Traceback (most recent call last):
File "labelme2voc.py", line 139, in
main()
File "labelme2voc.py", line 102, in main
cls, ins = labelme.utils.shapes_to_label(
File "/Users/azzz/.pyenv/versions/3.8.3/lib/python3.8/site-packages/labelme/utils/shape.py", line 69, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: truck
truck is the label I want to ignore
——————————————————————————————————
Hi, I have the same error, too.
Traceback (most recent call last):
File "./labelme2voc.py", line 106, in
main()
File "./labelme2voc.py", line 88, in main
label_name_to_value=class_name_to_id,
File "/Users/tajimakeijiro/anaconda3/envs/labelme/lib/python3.6/site-packages/labelme/utils/shape.py", line 68, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: wall
I wanted to ignore the class wall, so I removed it from labels.txt.
But I got this error.
二、解决办法
查看了labelme2voc.py源码,因此我们直接在源码中进行修改,修改方式比较愚笨但直接暴力,能够解决问题。
假设我们所有的标签crack,shedding,damage,face1,face2,face3,其中face1,face2,face3,是我们不需要的。 正常情况下我们转换所有标签,修改labels.txt,即
__ignore__
_background_
crack
shedding
damage
face1
face2
face3
background
如果我们不需要face1,face2,face3,从上面中删除face1,face2,face3会报错。我们只需要将如下代码添到labelme2voc.py中的class_names = tuple(class_names) 下面,即可达到忽略face1,face2,face3的目的。此时修改labels.txt操作变得可有可无了。
class_names=[_background_,crack,shedding,damage,face1,face2,face3,background]
class_name_to_id=__ignore__:-1,face1:0,face2:0,face3:0,_background_:0,crack:1,shedding:2,damage:3,background:4
如图所示:
最后正常运行labelme2voc.py即可。
三:原理和解释
在转换过程中,背景(background)用值0表示,因此我们如果忽视标签face1,face2,face3,我们将其也设置为0即可达到目的。
class_name表示所有的类别。其中_background_必须要有,
而crack,shedding,damage,face1,face2,face3,background是类别。
class_name_to_id表示这些类别的数字表示。其中的__ignore__:-1和_background_:0必须要有;
顺序写出来并赋值即可,从1开始。
四:总结
在使用labelme2voc.py时,进行调试,可以更好地理解添加上面两行代码的原理,这也是我使用该方法的思路来源。coco类型应该类似,可以自行调试或者构造出代码。
以上是关于labelme使用labelme2voc.py忽略部分标签生成VOC/coco类型数据集(Ignore a label in json file)的主要内容,如果未能解决你的问题,请参考以下文章
Labelme 批量转 dataset 使用 labelme_json_to_dataset 命令 (图文详解)