目标检测小脚本:Xml标签可视化

Posted zstar-_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了目标检测小脚本:Xml标签可视化相关的知识,希望对你有一定的参考价值。

前言

之前写过一个将YOLO中txt格式进行可视化的脚本目标检测】小脚本:YOLO标签可视化,这次来实现一个Xml格式标签可视化的脚本。

不啰嗦,直接放代码,效果和上文一样。

脚本代码

import xml.dom.minidom
import cv2
import os

"""
该脚本用于目标框可视化
IMAGE_INPUT_PATH:输入图片路径
XML_INPUT_PATH:输入标记框路径
IMAGE_OUTPUT_PATH:生成可视化图片路径
"""
IMAGE_INPUT_PATH = 'VOC2007/JPEGImages'
XML_INPUT_PATH = 'VOC2007/Annotations'
IMAGE_OUTPUT_PATH = 'VOC2007/show_output'
imglist = os.listdir(IMAGE_INPUT_PATH)
xmllist = os.listdir(XML_INPUT_PATH)

for i in range(len(imglist)):
    # 每个图像全路径
    image_input_fullname = IMAGE_INPUT_PATH + '/' + imglist[i]
    xml_input_fullname = XML_INPUT_PATH + '/' + xmllist[i]
    image_output_fullname = IMAGE_OUTPUT_PATH + '/' + imglist[i]

    img = cv2.imread(image_input_fullname)

    dom = xml.dom.minidom.parse(xml_input_fullname)
    root = dom.documentElement

    # 读取标注目标框
    objects = root.getElementsByTagName("bndbox")

    for object in objects:
        xmin = object.getElementsByTagName("xmin")
        xmin_data = int(float(xmin[0].firstChild.data))
        ymin = object.getElementsByTagName("ymin")
        ymin_data = int(float(ymin[0].firstChild.data))
        xmax = object.getElementsByTagName("xmax")
        xmax_data = int(float(xmax[0].firstChild.data))
        ymax = object.getElementsByTagName("ymax")
        ymax_data = int(float(ymax[0].firstChild.data))

        # xmin, ymin, xmax, ymax分别为xml读取的坐标信息
        left_top = (int(xmin_data), int(ymin_data))
        right_down = (int(xmax_data), int(ymax_data))
        cv2.rectangle(img, left_top, right_down, (255, 0, 0), 1)
        """
        # 直接查看生成结果图 
        cv2.imshow('show', img)
        cv2.waitKey(0)
        """

    cv2.imwrite(image_output_fullname, img)

以上是关于目标检测小脚本:Xml标签可视化的主要内容,如果未能解决你的问题,请参考以下文章

目标检测图像裁剪/标签可视化/图像拼接处理脚本

目标检测图像裁剪/标签可视化/图像拼接处理脚本

目标检测小脚本:根据xml文件统计类别数

目标检测小脚本:根据xml批量复制jpg图片

目标检测小脚本:提取训练集图片与标签并更新索引

目标检测小脚本:数据集划分