将图像数组和标签数据帧拆分为训练、测试和验证集

Posted

技术标签:

【中文标题】将图像数组和标签数据帧拆分为训练、测试和验证集【英文标题】:Split image array and labels dataframe into train, test and validataion sets 【发布时间】:2021-11-12 07:13:43 【问题描述】:

我有一个形状为 (30000, 128,128,3) 的图像数组(从 npy 文件加载)和一个形状为 (30000, 1) 的标签数据框。如何将它们拆分为训练集、测试集和验证集,以便继续构建 CNN 模型?

【问题讨论】:

【参考方案1】:

您可以使用包 sklearn。如果您的 imagew 数组为“X”且标签为“Y”,请使用:

>> from sklearn.model_selection import train_test_split

这个包在训练、测试和验证中拆分日期集:

>> X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=33)

参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html

编码愉快!!

【讨论】:

以上是关于将图像数组和标签数据帧拆分为训练、测试和验证集的主要内容,如果未能解决你的问题,请参考以下文章

如何将训练数据集拆分为训练,验证和测试数据集?

将主数据目录拆分为训练/验证/测试集

正确拆分数据集

R:如何将数据框拆分为训练集、验证集和测试集?

没有 scikit-learn 的分层训练/验证/测试拆分

如何在不使用和拆分测试集的情况下将我的数据集拆分为训练和验证?