使用 gsutil 从 CSV 下载所有行

Posted

技术标签:

【中文标题】使用 gsutil 从 CSV 下载所有行【英文标题】:Download all lines from CSV using gsutil 【发布时间】:2018-11-02 10:23:43 【问题描述】:

我正在尝试找出一种从单个存储桶下载多个文件的方法。 假设我有一个包含数百个文件的存储桶,我想下载其中的 65 个文件。

我显然可以去控制台并单独下载我需要的每个文件,但这不是很有效。

另一种选择是使用

下载整个文件夹
gsutil -m cp -r gs://bucket/folder [destination folder]

但是,这将下载所有文件,这也不方便。

我能否以某种方式在 CSV 中包含我想要的所有文件名并让 gsutil 迭代该 CSV 文件?

【问题讨论】:

【参考方案1】:

您不能直接使用 CSV 文件,但可以将 url 列表通过管道传输到 gsutil:

list_of_urls > gsutil -m cp -I ./download_dir

也许这已经足够了。

【讨论】:

以上是关于使用 gsutil 从 CSV 下载所有行的主要内容,如果未能解决你的问题,请参考以下文章

gsutil - 如何从谷歌私有云复制/下载所有文件?

使用 gsutil 下载 FireStorage 文件

Google BigQuery:如何使用 gsutil 删除或覆盖表?

将数据从谷歌数据存储复制到 CSV

使用 Gsutil 从 Google Cloud 下载文件夹

为啥 gsutil rsync 会重新下载我们所有的文件?