Python制作本地数据集

Posted junlong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python制作本地数据集相关的知识,希望对你有一定的参考价值。

技术图片
 1 #####################################################
 2 # 功能:Python制作本地数据集
 3 #####################################################
 4 
 5 # 导入相应包
 6 import os
 7 from PIL import Image
 8 import numpy as np
 9 from keras.utils import to_categorical
10 
11 dir_path = E:/prim/Sum  # 图片文件路径
12 labels = []
13 images = []
14 
15 dir_len = len(os.listdir(dir_path))   # os.listdir():返回指定目录下的所有文件和目录名   len() 方法返回对象(字符、列表、元组等)长度或项目个数
16 
17 # 直接读取单个中文文件夹
18 for i, name in enumerate(os.listdir(dir_path)):    # enumerate用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
19     print(%d/%d%(i+1, dir_len))
20 
21     if not name.endswith(.jpg):
22         continue
23     # 准备标签
24     label = np.array(int(name.split(_)[0][4:]))   # 以下划线取第一个数字
25 
26     # 准备图片
27     img = Image.open(os.path.join(dir_path, name)).resize((100, 100))  # 将每张图片固定成同样大小
28     img = np.array(img).astype(float32) / 0xff   # 转换成二进制数
29 
30     labels.append(label)
31     images.append(img)
32 
33 # 转numpy数组
34 images = np.array(images)
35 labels = np.array(labels)
36 labels = to_categorical(labels)
37 
38 print("images:", images.shape)
39 print("labels:", labels.shape)
40 
41 np.save(images, images)
42 np.save(labels, labels)
43 
44 print(done!)
Python制作本地数据集

以上是关于Python制作本地数据集的主要内容,如果未能解决你的问题,请参考以下文章

制作自己的python版本的类CIFAR10数据集

制作自己的python版本的类CIFAR10数据集

Python批量检测图片中的人脸并制作数据集(Dlib)

利用python爬取特定类别图片---labelimg制作自己的目标检测数据集

python数据集

TensorFlow 制作自己的TFRecord数据集