Hive 问题合集 持续更新

Posted 疯码牛

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 问题合集 持续更新相关的知识,希望对你有一定的参考价值。

一 hive建表信息中文乱码:显示问号等

问题现象:

主要原因:

  1 hive元数据库mysql 或者mariaDB 编码格式问题

  2 hive元数据定义信息编码格式问题

解决方案:

对于第一种问题:修改配置文件

在/etc/my.cnf文件中
在[mysqld]标签下添加
init_connect=\'SET collation_connection = utf8_unicode_ci\'
init_connect=\'SET NAMES utf8\'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

文件/etc/my.cnf.d/client.cnf
在[client]中添加
default-character-set=utf8

文件/etc/my.cnf.d/mysql-clients.cnf
在[mysql]中添加
default-character-set=utf8

全部配置完成,重启mariadb
systemctl restart mariadb

然后进入musql,执行 SHOW VARIABLES LIKE \'character%\';

 

对于第二种问题 :

1、查看存放Hive元数据信息的数据库表字符集;是否因为字符集问题

 

 很明显,由于表使用的是默认的latin1字符集,所以中文显示不出来,应该使用utf8;

2 登陆Mysql数据库切换到Hive元数据库:根据具体设定自行判断

修改以下两张表即可;
use hive 

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8; 
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8; 

如果创建了分区,要再加一条语句:
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8; 

 

以上是关于Hive 问题合集 持续更新的主要内容,如果未能解决你的问题,请参考以下文章

PAT甲级排队问题合集 (持续更新中)

小程序各种功能代码片段整理---持续更新

阿里开源项目合集(持续更新中)

在线工具技术网站合集(持续更新)

在线工具技术网站合集(持续更新)

萌生玩吧单机游戏合集,持续更新,一键下载,一次购买,长期下载。