hive表添加字段导致历史分区查询报错

Posted 一定要努力努力再努力

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive表添加字段导致历史分区查询报错相关的知识,希望对你有一定的参考价值。


一般由于业务需要,会对hive的表有增加字段的操作,如下:

ALTER TABLE 库名.表名 add columns (字段名 字段类型  comment '注释') ;

但是上面这种语法只能是对表的当前和以后新的分区生效,若存在历史分区,那么mysql上的元数据信息没有修改。
若查询历史分区,就会报上面的return code 2
解决方案:
1、直接在添加字段的时候加上 CASCADE

ALTER TABLE 库名.表名 add columns (字段名 字段类型  comment '注释')  CASCADE;

官方给出解释:cascade的中文翻译为“级联”,也就是不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构
2、若没加CASCADE已经修改了表结构了,可以在查询时设置下面参数

set hive.vectorized.execution.enabled=false;--关闭矢量查询
set hive.vectorized.execution.reduce.enabled=false;

以上是关于hive表添加字段导致历史分区查询报错的主要内容,如果未能解决你的问题,请参考以下文章

hive外部表分区

Hive 分区表初始化历史分区操作

Hive:分区表表结构和数据复制

hive 分区表

Hive分区参考

深入理解Hive分区与分桶