set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat; 解决 map 端的小文件进行合并

Posted 闭关苦炼内功

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat; 解决 map 端的小文件进行合并相关的知识,希望对你有一定的参考价值。

ods 层数据装载到 dim 层数据,出现 NULL 异常数据
原因:ods 层数据有 lzo文件的index索引文件,map端小文件合并把lzo的索引文件也给合并了,所以hive数据查询出现 NULL 异常数据

  • 查看hive默认数据存储格式

set hive.input.format;

默认是: org.apache.hadoop.hive.ql.io.CombineHiveInputFormat会对 map 端的小文件进行合并

  • 修改hive默认数据存储格式

所以需要修改为 org.apache.hadoop.hive.ql.io.HiveInputFormat

set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;

以上是关于set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat; 解决 map 端的小文件进行合并的主要内容,如果未能解决你的问题,请参考以下文章

从javabean中提取get和set方法。

org mode export setting

org.hibernate.MappingException:无法确定类型:java.util.Set,表:USERS,列:[org.hibernate.mapping.Column(invoices

.settings/org.eclipse.jdt.core.prefs 是项目的一部分吗?

org.hibernate.MappingException:无法确定类型:java.util.Set [重复]

多对多关系:org.hibernate.MappingException:无法确定类型:java.util.Set