Bigquery - 在一列中加载带有“#N/A”的 CSV

Posted

技术标签:

【中文标题】Bigquery - 在一列中加载带有“#N/A”的 CSV【英文标题】:Bigquery - loading CSV with "#N/A" in one column 【发布时间】:2021-08-18 10:21:51 【问题描述】:

如何使用 bq load (gsutil) 成功加载 csv,其中 FLOAT 列的值很少为 #N/A。

当我使用以下 bq 负载时出现以下错误

bq --location=australia-southeast1 load --max_bad_records=20 --allow_jagged_rows --skip_leading_rows=1 --source_format=CSV  DATASET1.T1.FILE1 gs://load_files/Test/FILE!.csv

错误 - 无法将 #N/A 解析为字段 blah blah 的双精度

不能修改 csv 文件

【问题讨论】:

【参考方案1】:

您可以尝试--null-marker 标志(参见here),将“#N/A”指定为特殊的空字符。

【讨论】:

完美。谢谢你

以上是关于Bigquery - 在一列中加载带有“#N/A”的 CSV的主要内容,如果未能解决你的问题,请参考以下文章

Bigquery 在日分区表中加载数据

为啥 Parquet 文件中的数据在 BigQuery 表中加载后与源数据不匹配

在BigQuery文件中加载列名称加载python

如何在 Google BigQuery 中加载大文本文件

如何将数据从按年/月/日分区的存储桶中加载到 bigquery

通过命令行在 BigQuery 中加载数据时出错:已更新