加载操作中的 BigQuery 错误:找不到 URI
Posted
技术标签:
【中文标题】加载操作中的 BigQuery 错误:找不到 URI【英文标题】:BigQuery error in load operation: URI not found 【发布时间】:2021-03-15 08:42:11 【问题描述】:在同一个 GCP 项目中,我有一个 BigQuery 数据集和一个云存储桶,都位于 us-central1 区域内。存储桶中有一个 parquet 文件。当我运行以下命令时:
bq load \
--project_id=myProject --location=us-central1 \
--source_format=PARQUET \
myDataSet:tableName \
gs://my-storage-bucket/my_parquet.parquet
失败并出现以下错误:
BigQuery error in load operation: Error processing job '[job_no]': Not found: URI gs://my-storage-bucket/my_parquet.parquet
删除--project_id
或--location
标签不会影响结果。
【问题讨论】:
【参考方案1】:想通了 - 文档不正确,我实际上必须将源声明为 gs://my-storage-bucket/my_parquet.parquet/part*
并且加载正常
【讨论】:
我很惊讶完整路径不起作用。我读过我们可以使用通配符,但从说明中将它们用于 paruqet 并不明显。【参考方案2】:BigQuery 在 3 月 3 日出现了一些内部问题,现已修复。
我已确认并使用以下命令使用 bq 命令将 parquet 文件从 Cloud Storage 成功上传到 BigQuery Table:
bq load --project_id=PROJECT_ID \
--source_format=PARQUET \
DATASET.TABLE_NAME gs://BUCKET/FILE.parquet
请注意,根据BigQuery Official Documentation,您必须将表的名称声明为DATASET.TABLE_NAME
(在帖子中,我可以看到:而不是。)
【讨论】:
以上是关于加载操作中的 BigQuery 错误:找不到 URI的主要内容,如果未能解决你的问题,请参考以下文章
如何解决 BigQuery 中的“在美国位置找不到数据集”错误?
GCP BigQuery 数据传输服务中的错误:找不到适合 jdbc:redshift:// 的驱动程序