将 Google Colab ipynb 推送到 Github?

Posted

技术标签:

【中文标题】将 Google Colab ipynb 推送到 Github?【英文标题】:Push Google Colab ipynb to Github? 【发布时间】:2018-07-20 12:56:10 【问题描述】:

我使用的是 Chromebook(库存设置),但对整个编码行业来说相对较新。目前,我正在尝试熟悉 Google Colaboratory 与 Google Drive 的结合,以便在任何地方进行数据分析。

我的问题是:由于我可以在 Colab 中通过!git 自动访问 Github,因此我创建了一个新的存储库并克隆了它。但我无法添加.ipynb,因为!git status 没有显示任何更改/没有看到我所在的笔记本作为文件。如何将我的 Google Drive 中的 .ipynb 推送回 Github?

基本上,我希望在任何地方拉起 Colab,玩弄我的数据,将更改保存在 .ipynb 中,推送到 Github,然后去其他地方继续玩数据。

手动复制可能可行,但有更优雅的解决方案吗?

TIA!

【问题讨论】:

【参考方案1】:

你现在可能已经想出了一个解决方案,但是我看到 Colab 现在有一个“将副本保存到 Github”的功能,引用自 this blog post:

您还可以使用 File > Save a copy to Github...轻松地将 Colab 笔记本的副本保存到 Github...

【讨论】:

【参考方案2】:

@jaymullr,你找到路了吗?

这里是如何使用 Clouderizer 从 github 轻松设置 notebook 到 Google Colab 的教程:Medium tutorial。好吧,也许你想要的恰恰相反,谷歌 Colab 到 github。令人兴奋的是,使用 clouderizer 可以让您两者兼得!同步您的 jupyter notebook、github 和 Colab。我的步骤可能看起来很长,但实际上非常简单,一次设置即可。以下是我的做法(如果您只想了解大致情况,请跳至 同步回 GitHub):

Google Colab 项目的 Clouderizer

先决条件

    注册 google/gmail 帐户 注册Clouderizer account [链接] 在您的 github 上创建一个存储库,并将您的项目(所有 ipynb、py 模块,甚至数据集(如果

设置 Clouderizer 项目

    登录到 Clouderizer 控制台。首次登录时,系统会提示您将 Google Drive 与 Clouderizer 链接。按照屏幕上的说明进行操作。如果它没有提示链接,您可以通过转到 Clouderizer 仪表板-> 侧边栏菜单-> Clouderizer Drive 来配置您的 Google Drive。 Clouderizer 将在您的 Google Drive 中设置一个名为“clouderizer”的文件夹,以包含您的 ipynb 项目(无论是机器学习项目还是任何项目) 返回到 Clouderizer 仪表板。然后单击新建项目。按照说明操作,您可以选择加载包含您打算上传到 Google Colab 的 ipynb 工作的整个 github 项目。 在第 5 步中,您可以通过指定数据集的 URL(例如,来自 kaggle 数据集 URL)来包含要处理的其他数据集。您还可以选择并指定是否要通过为数据集、主要代码/模块和输出文件设置单独的文件夹来重构您的项目。 接下来,前往 Google Colab/在 Google 云端硬盘的任何位置创建一个 Google Colab 文件,然后执行:!wget NS -content disposition 'https://to_whatever_link_you_get_to_console' 最后,返回 Clouderizer 仪表板并检查您的项目环境是否已经在运行并同步到 Google Colab。然后单击该仪表板中的 jupyter notebook 图标,就在您提供的项目的标题名称旁边。现在,您可以像在本地机器上一样开始进行机器学习或任何工作,然后立即在 Google Colab 上同步。 最后,您将能够验证您的 .ipynb 是否可以工作,并且也能够在 Google Colab 中导入模块/数据集。只需返回 Google Drive->clouderizer 文件夹->您的项目。然后尝试运行,看看是否一切正常,就像在 jupyter notebook 中一样。

同步回 github

    这里没有什么特别的。回到 Clouderizer jupyter notebook,在根/***目录和$git push origin master 中打开终端。就是这样!

如果你觉得我的方式很有趣,请点赞。但是,这种方法一开始可能太乏味了。让我知道你的想法!顺便说一句,Clouderizer 是免费的。

【讨论】:

以上是关于将 Google Colab ipynb 推送到 Github?的主要内容,如果未能解决你的问题,请参考以下文章

关于 Google Colab Transformer 教程的问题

text 在Colab.ipynb中的Plotly

无法使用 OCI 将 Helm Chart 推送到 Google Cloud Artifact Registry

使用python和管理api将外部数据推送到google analytics 360

如何使用 Google Cloud Messaging 将通知推送到 iOS

在 Terraform 中创建 google_logging_project_sink 不会将事件推送到 Pub/Sub