高分辨率图像建筑物提取数据集制作
Posted dean0731
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了高分辨率图像建筑物提取数据集制作相关的知识,希望对你有一定的参考价值。
目录结构
/dataset/ xxxx.tif # 原始图像 image-3000 0.tif # 切割后的tif 1.tif ........ 0.json # 生成的json文件也放在该文件夹下 1.json ....... 0_json # 调用labelme_json_to_dataset 0.json 生成的0_json文件夹 img.png # 原始图片的png格式 info.yaml label.png # 标签图片 label_names.txt label_viz.png 1_json ....... 0.png # 将json文件夹中的label.png 提取出来 1.png ....... label_0.tif # 将上边的png标签文件转换为tif格式
收集数据,高分辨率图像
- 无人机数据,航空数据等
图像切割,像素大小该为多少?
本数据集平均像素大小(40000*50000) tif格式,LZW压缩方式压缩
要考虑计算机显卡,目标建筑无尽量不被切割等问题,本利使用3000*3000
# data:2020-01-04 # user:dean # desc:图像切割脚本 import tifffile as tiff # 也可使用pillow或opencv 但若图片过大时可能会出问题 import os image = r"I:人工智能数据DOM裴庄村51-dom裴庄村51-dom.tif" target_dir = r"I:人工智能数据DOM裴庄村51-domimage-3000" # 切割后图片存储位置 width = 1500*2 # 切割图像大小 height = 1500*2 # 切割图像大小 img = tiff.imread(image) # 导入图片 print("导入图片完成",img.shape) # 原始图片大小 pic_width = img.shape[1] pic_height = img.shape[0] row_num = pic_width//width # 纵向切割数量 col_num = pic_height // height # 横向切割数量 print("开始进行切割,可切割总数为{}".format(col_num*row_num)) for j in range(col_num): for i in range(row_num): num = j * row_num + i print("正在进行第{}张切割".format(num + 1)) row = i * width row_end = row + width col = j * height col_end = col + height # print(col,col_end,row,row_end) cropped = img[col:col_end,row:row_end] name = "{}.tif".format(num) image_path = os.path.join(target_dir,name) tiff.imsave(image_path, cropped)
标注工具 labelme
使用label标注每张图片
pip install labelme # 安装labelme
每张图片标注后会生成对应name.json文件
labelme_json_to_dataset xxx.json
# data:2020-01-04 # user:dean # desc:批量将json文件转为 label import os dir = r"I:人工智能数据DOM裴庄村51-domimage-3000" files = [os.path.join(dir,file) for file in os.listdir(dir) if file.endswith(".json")] for file in files: cmd = "labelme_json_to_dataset {}".format(file) print(cmd) os.system(cmd)
将所有的json/label.png 提取到统一文件夹
# data:2020-01-04 # user:dean # desc:将label文件夹中的laebl提取出来 import tifffile as tiff from PIL import Image import os target_dir = r"I:人工智能数据DOM裴庄村51-domimage-3000" # json_label 所在的文件夹 files = [os.path.join(target_dir,file) for file in os.listdir(target_dir)] for i in files: if os.path.isdir(i): lables = os.listdir(i) for file in lables: if file == "label.png": imgae = Image.open(os.path.join(i, "label.png")) name = "{}.png".format(i.split("_")[0]) imgae.save(os.path.join(target_dir,name)) print("第{}个文件夹".format(i)) break;
将所有的label.png转换为tif格式
# coding:utf-8 # file: change_format.py # author: Dean # contact: 1028968939@qq.com # time: 2020/1/4 20:41 # desc:图片格式转换 from PIL import Image import os target_dir = "I:人工智能数据DOM裴庄村51-domimage-3000" # png 图片所在文件夹 files = [os.path.join(target_dir,file) for file in os.listdir(target_dir)] print(files) for file in files: if file.endswith(".png"): name = os.path.basename(file) new_name = "label_{}.tif".format(name.split(".")[0]) image = Image.open(file) path = os.path.join(target_dir, new_name) image.save(path) print(path)
结束(根据需要提取相应数据即可)
以上是关于高分辨率图像建筑物提取数据集制作的主要内容,如果未能解决你的问题,请参考以下文章
text bash:使用imagemagick(递归)从pdf中提取高分辨率图像
图像融合基于matlab高分辨率全色图PCA图像融合(含评价指标)含Matlab源码 2407期
武汉大学CVEO小组:一种基于卷积神经网络(CNN)的高分辨率遥感影像分类方法