将 XLS 文件从 GCS 导入 BigQuery

Posted

技术标签:

【中文标题】将 XLS 文件从 GCS 导入 BigQuery【英文标题】:Import XLS file from GCS to BigQuery 【发布时间】:2019-08-06 01:50:35 【问题描述】:

我的 Google Cloud Storage 中有一些 .xls 数据,我想使用气流将其存储到 GCP。我可以将其直接导出到 BigQuery,还是可以使用其他库(例如 pandas 和 xlrd)来转换文件并将其存储到 BigQuery 中? 谢谢

【问题讨论】:

【参考方案1】:

Bigquery 不支持 xls 格式。最简单的方法是将文件转换为 CSV 并将其加载到大查询中。 但是,我不知道您的 xls 格式。如果它是多页的,您必须处理文件。

【讨论】:

以上是关于将 XLS 文件从 GCS 导入 BigQuery的主要内容,如果未能解决你的问题,请参考以下文章

无法将 csv 文件从 GCS 加载到 bigquery

使用 Dataflow 管道 (python) 将多个 Json zip 文件从 GCS 加载到 BigQuery

如何限制从 bigquery 导出到 gcs 的文件大小?

是否可以使用 UDF 从 BigQuery 读取 gcs 对象的元数据

GCP将数据作为字符串从GCS中的CSV文件加载到BigQuery表中

将 CSV 从 GCS 批量加载到 BigQuery 时,表数据是增量查看还是仅在所有文件加载后才可查看?