如何将带小数字段的镶木地板文件加载到BigQuery中?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将带小数字段的镶木地板文件加载到BigQuery中?相关的知识,希望对你有一定的参考价值。

我们有一个名为parq store的表作为镶木地板,并且在parq中有一个十进制的字段。

当我将parq加载到BigQuery时,我收到一条消息:

“不支持字段'field_name'的Parquet类型'FIXED_LEN_BYTE_ARRAY'(DECIMAL)。”

加载结果:

等待bqjob_r70dd180dddb0942d_00000160bb2ff706_1 ...(1s)当前状态:DONE查询字符串中的错误:处理作业'project_id:bqjob_r70dd180dddb0942d_00000160bb2ff706_1'时出错:不支持字段'field_name'的Parquet类型'FIXED_LEN_BYTE_ARRAY'(DECIMAL)。

命令:

bq load --source_format=PARQUET --time_partitioning_type=DAY "dataset.table$20171001" "gs://data.0.parq"

如何将像data.0.parq这样的镶木地板文件加载到Bigquery中?

谢谢。

答案

BigQuery尚不支持DECIMAL类型。据谷歌称,应该在第一季度做好准备:https://issuetracker.google.com/issues/35906014

所以同时我猜你必须把这个字段放到Float中才能把它存放到Parquet中

以上是关于如何将带小数字段的镶木地板文件加载到BigQuery中?的主要内容,如果未能解决你的问题,请参考以下文章

无法使用 Pyspark 2.4.4 读取 s3 存储桶中的镶木地板文件

Pyspark:从不同的目录加载类似的镶木地板,并将文件夹名称作为一列组合成一个 DataFrame [重复]

拥有一个大的镶木地板文件还是拥有许多较小的镶木地板文件更好?

如何在读取前根据定义的模式读取 pyspark 中的镶木地板文件?

我对镶木地板文件和 python 完全陌生,谁能告诉我如何在 pyspark 中读取带有标题的镶木地板文件

更新取决于自己的数据的镶木地板文件的最佳方法