如何将带小数字段的镶木地板文件加载到BigQuery中?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将带小数字段的镶木地板文件加载到BigQuery中?相关的知识,希望对你有一定的参考价值。
我们有一个名为parq store的表作为镶木地板,并且在parq中有一个十进制的字段。
当我将parq加载到BigQuery时,我收到一条消息:
“不支持字段'field_name'的Parquet类型'FIXED_LEN_BYTE_ARRAY'(DECIMAL)。”
加载结果:
等待bqjob_r70dd180dddb0942d_00000160bb2ff706_1 ...(1s)当前状态:DONE查询字符串中的错误:处理作业'project_id:bqjob_r70dd180dddb0942d_00000160bb2ff706_1'时出错:不支持字段'field_name'的Parquet类型'FIXED_LEN_BYTE_ARRAY'(DECIMAL)。
命令:
bq load --source_format=PARQUET --time_partitioning_type=DAY "dataset.table$20171001" "gs://data.0.parq"
如何将像data.0.parq这样的镶木地板文件加载到Bigquery中?
谢谢。
BigQuery尚不支持DECIMAL类型。据谷歌称,应该在第一季度做好准备:https://issuetracker.google.com/issues/35906014
所以同时我猜你必须把这个字段放到Float中才能把它存放到Parquet中
以上是关于如何将带小数字段的镶木地板文件加载到BigQuery中?的主要内容,如果未能解决你的问题,请参考以下文章
无法使用 Pyspark 2.4.4 读取 s3 存储桶中的镶木地板文件
Pyspark:从不同的目录加载类似的镶木地板,并将文件夹名称作为一列组合成一个 DataFrame [重复]
拥有一个大的镶木地板文件还是拥有许多较小的镶木地板文件更好?
如何在读取前根据定义的模式读取 pyspark 中的镶木地板文件?