hive问题汇集贴

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive问题汇集贴相关的知识,希望对你有一定的参考价值。

(原创文章,谢绝转载~)

hive的使用中遇到问题汇集贴:

  • HIVE-9146 的bug (新版本已fixed),见 issues.apache.org/jira/browse/HIVE-9146, left join时关联条件顺序不一致导致错误结果。

          旧版本hive关联条件要写成如     ... on  tb1.a=tb2.b  and   tb1.c=tb2.d ...

                                                            ... on  tb1.a=tb3.b  and   tb1.c=tb3.d ...  

                                       (这里若写成  on   tb1.c=tb3.d    and   tb1.a=tb3.b    仅顺序改变,会导致错误结果)

                                                            ... on  tb1.a=tb4.b  and   tb1.c=tb4.d ...

  • hive的默认fields的分隔符是 \001 ,当原始数据文件中出现这个时,即便指定新的分隔符例如逗号,在load数据时也会出现混乱错位。
  • 处理分号“;”相关,例如数据加上分号,要用\073代替直接写分号,concat(column,‘;‘)报错,concat(column,‘\073‘) 可以。
  • 子查询的表需要加上一个别名。
  • hiveql的正则式中(rlike、regexp、regexp_extract(str,regex,index) ),例如匹配数字需要写 \\d 代替 \d 。

以上是关于hive问题汇集贴的主要内容,如果未能解决你的问题,请参考以下文章

技术贴hadoop之hive数据仓库的常用语句,请随时翻阅

一脸懵逼学习Hive的安装

Hive UDAF 中的 NullPointErexception

广东国际时尚艺术研究院 דHIVE-showroom•䎆”开启本土时尚盛事

根据JSON创建对应的HIVE表

说说单节点集群里安装hive35节点集群里安装hive的诡异区别