将图像数组和标签数据帧拆分为训练、测试和验证集
Posted
技术标签:
【中文标题】将图像数组和标签数据帧拆分为训练、测试和验证集【英文标题】:Split image array and labels dataframe into train, test and validataion sets 【发布时间】:2021-11-12 07:13:43 【问题描述】:我有一个形状为 (30000, 128,128,3) 的图像数组(从 npy 文件加载)和一个形状为 (30000, 1) 的标签数据框。如何将它们拆分为训练集、测试集和验证集,以便继续构建 CNN 模型?
【问题讨论】:
【参考方案1】:您可以使用包 sklearn。如果您的 imagew 数组为“X”且标签为“Y”,请使用:
>> from sklearn.model_selection import train_test_split
这个包在训练、测试和验证中拆分日期集:
>> X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=33)
参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
编码愉快!!
【讨论】:
以上是关于将图像数组和标签数据帧拆分为训练、测试和验证集的主要内容,如果未能解决你的问题,请参考以下文章