将包含约 20K 图像的文件夹添加到 Google Colaboratory

Posted

技术标签:

【中文标题】将包含约 20K 图像的文件夹添加到 Google Colaboratory【英文标题】:Add a folder with ~20K of images into Google Colaboratory 【发布时间】:2018-08-11 19:00:19 【问题描述】:

我正在使用 Keras 进行猫品种识别,并尝试使用 Google Colaboratory 在 GPU 上进行训练。当我在 PyCharm 工作时,我使用了带有图像的文件夹路径:

data_dir = '//home//kate//Рабочий стол//барахло линух минт//more_breeds_all_new'

我不明白,我怎样才能将一个包含 19500 张图像的文件夹下载到 Colab,而不是像谷歌在它的笔记本中提供的那样一张一张地加载图片。 我在 Google Drive 上也有一个包含这些图像的文件夹,但我也不知道如何将其用作完整文件夹及其路径。

【问题讨论】:

阅读tour 和help center。这不是一个真正的编程问题,而更像是一个谷歌问题。 【参考方案1】:

首先:.zip .tar 格式的 zip 图像文件夹,示例 folder_data.zip 并将其(folder_data.zip)同步或上传到 Google Drive。

获取 1iytA1n2z4go3uVCwE_vIKouTKyIDjEq 之类 zip 文件(folder_data.zip) 的 google drive file_id

第二: 我建议您使用 Pydrive 将您的文件从 google drive 下载到 colab notebook VM。我下载了 500MB 的数据集 5s。 1.安装Pydrive

!pip install PyDrive

2。 OAout

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# Authenticate and create the PyDrive client.
# This only needs to be done once in a notebook.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

    从谷歌驱动器下载文件的代码

    fileId = drive.CreateFile('id': 'DRIVE_FILE_ID') #DRIVE_FILE_ID is file id example: 1iytA1n2z4go3uVCwE_vIKouTKyIDjEq print fileId['title'] # folder_data.zip fileId.GetContentFile('folder_data.zip') # Save Drive file as a local file

最后:解压到文件夹,这里的例子是

!unzip folder_data.zip -d ./

列表文件的样子

folder_data.zip
folder_data/

为莫圣战加油

【讨论】:

以上是关于将包含约 20K 图像的文件夹添加到 Google Colaboratory的主要内容,如果未能解决你的问题,请参考以下文章

如何将添加到Google表格单元格中的图像保存到Google云端硬盘?

将KMZ文件上传到我的Google地图中,并在地标描述中添加图像

从 Google Drive 将图像添加到 GitHub Readme.md

将文件从 Google Cloud Storage 添加到云端硬盘

Joomla 3 自定义插件安装:将包含图像的文件夹从 zip 添加到图像文件夹

以编程方式将图像添加到线性布局