如何在Hue中配置Impala的负载均衡
Posted Hadoop实操
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在Hue中配置Impala的负载均衡相关的知识,希望对你有一定的参考价值。
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
Fayson的github:https://github.com/fayson/cdhproject
提示:代码块部分可以左右滑动查看噢
1.文档编写目的
在前面的文章Fayson介绍了《》、《》和《》。本篇文章主要基于Haproxy方式实现的Impala负载均衡在Hue中配置Impala服务的负载均衡。
内容概述
1.测试环境描述
2.Hue配置Impala负载均衡
3.测试Impala负载均衡
4.总结
测试环境
1.CM和CDH版本为5.13.1
2.Haproxy版本为1.5.18
前置条件
1.已配置好Haproxy实现的Impala负载均衡
2.环境描述
在CDH集群中使用Haproxy配置Impala服务的负载均衡,具体可参看Fayson前面的文章《》。
注:上图标注部分impalajdbc必须配置,否则在Hue中无法配置Impala的负载均衡。
Haproxy的配置如下:
global
# to have these messages end up in /var/log/haproxy.log you will
# need to:
#
# 1) configure syslog to accept network log events. This is done
# by adding the '-r' option to the SYSLOGD_OPTIONS in
# /etc/sysconfig/syslog
#
# 2) configure local2 events to go to the /var/log/haproxy.log
# file. A line like the following can be added to
# /etc/sysconfig/syslog
#
# local2.* /var/log/haproxy.log
#
log 127.0.0.1 local2
chroot /var/lib/haproxy
pidfile /var/run/haproxy.pid
maxconn 4000
user haproxy
group haproxy
daemon
# turn on stats unix socket
stats socket /var/lib/haproxy/stats
#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------
defaults
mode http
log global
option httplog
option dontlognull
#option http-server-close
#option forwardfor except 127.0.0.0/8
option redispatch
retries 3
timeout http-request 10s
timeout queue 1m
timeout connect 10s
timeout client 1m
timeout server 1m
timeout http-keep-alive 10s
timeout check 10s
maxconn 3000
listen stats
bind 0.0.0.0:1080
mode http
option httplog
maxconn 5000
stats refresh 30s
stats uri /stats
listen hivejdbc
bind 0.0.0.0:10099
mode tcp
option tcplog
balance source
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:10000 check
server ip-172-31-6-148.fayson.com ip-172-31-6-148.fayson.com:10000 check
listen impalashell
bind 0.0.0.0:25003
mode tcp
option tcplog
balance leastconn
server cdh04.fayson.com cdh04.fayson.com:21000 check
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21000 check
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21000 check
listen impalajdbc
bind 0.0.0.0:25004
mode tcp
option tcplog
balance source
server cdh04.fayson.com cdh04.fayson.com:21050 check
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21050 check
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21050 check
(可左右滑动)
3.修改Hue配置
1.使用管理员登录Cloudera Manager的WEB控制台,进入hue服务的配置项页面
2.在配置项搜索”hue_safety_valve.ini”,在该配置项增加如下配置
[impala]
server_host=ip-172-31-7-172.fayson.com
server_port=25004
配置项说明:
server_port: Haproxy中配置监听的impalajdbc的端口25004。
3.保存配置,回到CM主页根据提示重启Hue及相关服务
4.测试Impala是否正常访问
这里我们使用两个浏览器登录Hue,来对Impala进行操作,查看Haproxy是否有负载均衡。
1.使用谷歌浏览器登录Hue,执行SELECT操作
查看此时Haproxy的监控界面,可以看到使用谷歌浏览器登录操作Impala连接的是ip-172-31-10-118.fayson.com节点的Impala Daemon服务
2.使用Safari浏览器登录Hue,执行SELECT操作
SQL执行成功,查看此时Haproxy的监控界面,可以看到使用Safari浏览器登录操作Impala连接的是cdh04.fayson.com节点的Impala Daemon服务
5.总结
在Hue中配置连接多个ImpalaDaemon需要先配置Impala服务JDBC的负载均衡。
在配置impalajdbc的Haproxy时需要将负载均衡的策略指定为balance source否则在使用时会报“Results have expired, rerun the query ifneeded”
提示:代码块部分可以左右滑动查看噢
为天地立心,为生民立命,为往圣继绝学,为万世开太平。
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。
以上是关于如何在Hue中配置Impala的负载均衡的主要内容,如果未能解决你的问题,请参考以下文章