在 Google Colab 中拆分文件以进行训练和测试

Posted

技术标签:

【中文标题】在 Google Colab 中拆分文件以进行训练和测试【英文标题】:Split files for train and test in Google Colab 【发布时间】:2019-07-22 09:00:13 【问题描述】:

我已经在本地 jupyter notebook 上成功训练和测试了我的模型,但我想在 Google Colab 中尝试相同的代码,因为我想尝试其他昂贵的 CNN 模型。 有人可以帮我这里有什么问题。我已从我的 Google Drive 将我的文件上传到 Google Colab 环境中。在这里,我想从 100 个文件夹中拆分文件以进行训练和测试,但每次我收到没有这样的文件或目录的错误。

folder = 'sample_data/firmasSINTESISmanuscritas'
number_of_users = 100
count_of_users = 0
for dir in os.listdir(folder):
print(dir)
filenames = [
    #os.path.join(os.path.dirname(os.path.abspath(__file__)), folder+'\\'+dir, i) for i in os.listdir(folder+'\\'+dir)
    os.path.join(folder+'\\'+dir, i) for i in os.listdir(folder+'\\'+dir)
]
filenames = filenames[:-1]

labels = [filename.__contains__('c-') for filename in filenames]
labels = np.array(labels, dtype=bool).astype(int).tolist()

x_train, x_test, y_train, y_test = train_test_split(filenames, labels, test_size=0.3, random_state=42)

filenames_train = filenames_train + x_train
filenames_test = filenames_test + x_test
Y_train = Y_train + y_train
Y_test = Y_test + y_test

count_of_users += 1
if number_of_users <= count_of_users:
    break
print('end')

[Error][1]

【问题讨论】:

【参考方案1】:

您是否已将您的谷歌驱动器安装到 colab 以访问这些文件?如果没有,请按照 this blog post中提到的命令进行操作。

【讨论】:

是的,我已经安装了它,并且我的数据集已从驱动器下载到工作空间。 可以分享一下你在colab中的目录结构吗?

以上是关于在 Google Colab 中拆分文件以进行训练和测试的主要内容,如果未能解决你的问题,请参考以下文章

如何在谷歌 colab 中读取图像数据集以进行深度学习?

神经网络学习小记录70——Pytorch 使用Google Colab进行深度学习

Google colab 上的结果与本地结果不同

如果我断开连接,Google Colab 会继续运行单元以将文件保存在已安装的驱动器中吗?

使用大数据集在 Google Colab TPU 上训练 seq2seq 模型 - Keras

将本地训练的 TensorFlow 模型导入 Google Colab