从谷歌云上传多个 csv 到 bigquery

Posted

技术标签:

【中文标题】从谷歌云上传多个 csv 到 bigquery【英文标题】:upload multiple csv from google cloud to bigquery 【发布时间】:2013-12-19 03:19:05 【问题描述】:

我需要从我的 Google 存储桶上传多个 CSV 文件。创建数据集时尝试指向存储桶,但收到错误消息。也试过了

gsutil load <projectID:dataset.table> gs://mybucket

它没有工作。

我需要一次上传多个文件,因为我的总数据是 2-3 TB 并且有大量文件

【问题讨论】:

bq load --autodetect --noreplace --source_format=CSV --skip_leading_rows=1 [my-dataset].[my-table] gs://[my-bucket]/[my-文件夹]/* 【参考方案1】:

你已经接近了。 Google Cloud Storage 使用 gsutil,但 BigQuery 的命令行实用程序是“bq”。您要查找的命令是bq load &lt;table&gt; gs://mybucket/file.csv

bq 的文档在这里:https://developers.google.com/bigquery/bq-command-line-tool

【讨论】:

以上是关于从谷歌云上传多个 csv 到 bigquery的主要内容,如果未能解决你的问题,请参考以下文章

从谷歌云存储中的 csv 加载数据作为 bigquery 'in' 查询

用于将数据从谷歌电子表格加载到 bigquery 的独立脚本

将 JSON 从 googlecloud 存储上传到 bigquery 时出现混淆

将数据从谷歌数据存储复制到 CSV

无法使用 python 将 JSON 文件从谷歌云存储加载到 bigquery

将工作从谷歌云存储插入谷歌大查询时路径无效