EMR问题

Posted hongfeng2019

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了EMR问题相关的知识,希望对你有一定的参考价值。

参考:

https://dbaplus.cn/news-11-1983-1.html

 

 

1/连接参数

技术图片

 

 

hive.server2.thrift.min.worker.threads  5 

hive.server2.thrift.max.worker.threads    150

在emr中hive-hiveserver2-site中自定义添加

 

 

 2/ hive.driver.parallel.compilation参数默认为false,导致HS2只允许同时一个Query编译, 有操作元数据比较多的查询编译读取元数据会比较慢,全局锁会卡住所有其他查询。 需要设置为true,打开允许多个Query同时编译。

技术图片

 

 

hive-site:

hive.driver.parallel.compilation 这个参数可以设置为true

 

hive&hue优化

1、hue配置文件,修改max_number_of_sessions值大小,修改为10
[beeswax]
max_number_of_sessions=10
2、hue
hue的server_conn_timeout调大点
hive:
1、自定义hive配置中,增加这个属性:
hive.server2.parallel.ops.in.session=true
2、hive
将hiveserver2和mestatore的堆大小调大一些

 

3/ 字符集问题见mysql

4/ 队列问题见emr fair-scheduler

以上是关于EMR问题的主要内容,如果未能解决你的问题,请参考以下文章

EMR问题

在 EMR 集群上引导 Spark 3.0.0

创建 EMR 集群时出错,EMR 服务角色无效

从 EMR spark 连接到 EMR presto - 连接失败

EMR 集群中的“LOST”节点

如何设置支持 Impala 的 EMR 集群?