加载操作中的 BigQuery 错误:找不到 URI

Posted

技术标签:

【中文标题】加载操作中的 BigQuery 错误:找不到 URI【英文标题】:BigQuery error in load operation: URI not found 【发布时间】:2021-03-15 08:42:11 【问题描述】:

在同一个 GCP 项目中,我有一个 BigQuery 数据集和一个云存储桶,都位于 us-central1 区域内。存储桶中有一个 parquet 文件。当我运行以下命令时:

bq load \
--project_id=myProject --location=us-central1 \
--source_format=PARQUET \
myDataSet:tableName \
gs://my-storage-bucket/my_parquet.parquet

失败并出现以下错误:

BigQuery error in load operation: Error processing job '[job_no]': Not found: URI gs://my-storage-bucket/my_parquet.parquet

删除--project_id--location 标签不会影响结果。

【问题讨论】:

【参考方案1】:

想通了 - 文档不正确,我实际上必须将源声明为 gs://my-storage-bucket/my_parquet.parquet/part* 并且加载正常

【讨论】:

我很惊讶完整路径不起作用。我读过我们可以使用通配符,但从说明中将它们用于 paruqet 并不明显。【参考方案2】:

BigQuery 在 3 月 3 日出现了一些内部问题,现已修复。

我已确认并使用以下命令使用 bq 命令将 parquet 文件从 Cloud Storage 成功上传到 BigQuery Table:

bq load --project_id=PROJECT_ID \
--source_format=PARQUET \
DATASET.TABLE_NAME gs://BUCKET/FILE.parquet

请注意,根据BigQuery Official Documentation,您必须将表的名称声明为DATASET.TABLE_NAME(在帖子中,我可以看到:而不是。)

【讨论】:

以上是关于加载操作中的 BigQuery 错误:找不到 URI的主要内容,如果未能解决你的问题,请参考以下文章

如何解决 BigQuery 中的“在美国位置找不到数据集”错误?

奇怪的问题:找不到 Bigquery 数据集

GCP BigQuery 数据传输服务中的错误:找不到适合 jdbc:redshift:// 的驱动程序

在 BigQuery 视图中找不到字段

加载操作中的 BigQuery 错误:令牌无效 - 令牌无效:无状态令牌已过期

BigQuery 创建表错误:在位置找不到数据集