如何在Hue中配置Impala的负载均衡

Posted Hadoop实操

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在Hue中配置Impala的负载均衡相关的知识,希望对你有一定的参考价值。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


Fayson的github:https://github.com/fayson/cdhproject


提示:代码块部分可以左右滑动查看噢


1.文档编写目的



在前面的文章Fayson介绍了《》、《》和《》。本篇文章主要基于Haproxy方式实现的Impala负载均衡在Hue中配置Impala服务的负载均衡。


  • 内容概述

1.测试环境描述

2.Hue配置Impala负载均衡

3.测试Impala负载均衡

4.总结


  • 测试环境

1.CM和CDH版本为5.13.1

2.Haproxy版本为1.5.18


  • 前置条件

1.已配置好Haproxy实现的Impala负载均衡


2.环境描述



在CDH集群中使用Haproxy配置Impala服务的负载均衡,具体可参看Fayson前面的文章《》。



注:上图标注部分impalajdbc必须配置,否则在Hue中无法配置Impala的负载均衡。

Haproxy的配置如下:


global
   # to have these messages end up in /var/log/haproxy.log you will
   # need to:
   #
   # 1) configure syslog to accept network log events.  This is done
   #    by adding the '-r' option to the SYSLOGD_OPTIONS in
   #    /etc/sysconfig/syslog
   #
   # 2) configure local2 events to go to the /var/log/haproxy.log
   #   file. A line like the following can be added to
   #   /etc/sysconfig/syslog
   #
   #    local2.*                       /var/log/haproxy.log
   #
   log         127.0.0.1 local2
   chroot      /var/lib/haproxy
   pidfile     /var/run/haproxy.pid
   maxconn     4000
   user        haproxy
   group       haproxy
   daemon
   # turn on stats unix socket
   stats socket /var/lib/haproxy/stats
#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------
defaults
   mode                    http
   log                     global
   option                  httplog
   option                  dontlognull
   #option http-server-close
   #option forwardfor       except 127.0.0.0/8
   option                  redispatch
   retries                 3
   timeout http-request    10s
   timeout queue           1m
   timeout connect         10s
   timeout client          1m
   timeout server          1m
   timeout http-keep-alive 10s
   timeout check           10s
   maxconn                 3000
listen stats
   bind 0.0.0.0:1080
   mode http
   option httplog
   maxconn 5000
   stats refresh 30s
   stats  uri /stats
listen hivejdbc
   bind 0.0.0.0:10099
   mode tcp
   option tcplog
   balance source
   server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:10000 check
   server ip-172-31-6-148.fayson.com ip-172-31-6-148.fayson.com:10000 check
listen impalashell
   bind 0.0.0.0:25003
   mode tcp
   option tcplog
   balance leastconn
   server cdh04.fayson.com cdh04.fayson.com:21000 check
   server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21000 check
   server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21000 check
listen impalajdbc
   bind 0.0.0.0:25004
   mode tcp
   option tcplog
   balance source
   server cdh04.fayson.com cdh04.fayson.com:21050 check
   server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21050 check
   server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21050 check

(可左右滑动)


3.修改Hue配置



1.使用管理员登录Cloudera ManagerWEB控制台,进入hue服务的配置项页面


如何在Hue中配置Impala的负载均衡


2.在配置项搜索”hue_safety_valve.ini”,在该配置项增加如下配置


[impala]
server_host=ip-172-31-7-172.fayson.com
server_port=25004


如何在Hue中配置Impala的负载均衡


配置项说明:

server_port: Haproxy中配置监听的impalajdbc的端口25004


3.保存配置,回到CM主页根据提示重启Hue及相关服务


如何在Hue中配置Impala的负载均衡


4.测试Impala是否正常访问



这里我们使用两个浏览器登录Hue,来对Impala进行操作,查看Haproxy是否有负载均衡。


1.使用谷歌浏览器登录Hue,执行SELECT操作


如何在Hue中配置Impala的负载均衡


查看此时Haproxy的监控界面,可以看到使用谷歌浏览器登录操作Impala连接的是ip-172-31-10-118.fayson.com节点的Impala Daemon服务


如何在Hue中配置Impala的负载均衡


2.使用Safari浏览器登录Hue,执行SELECT操作


如何在Hue中配置Impala的负载均衡


SQL执行成功,查看此时Haproxy的监控界面,可以看到使用Safari浏览器登录操作Impala连接的是cdh04.fayson.com节点的Impala Daemon服务



5.总结



  • Hue中配置连接多个ImpalaDaemon需要先配置Impala服务JDBC的负载均衡。

  • 在配置impalajdbcHaproxy时需要将负载均衡的策略指定为balance source否则在使用时会报“Results have expired, rerun the query ifneeded



提示:代码块部分可以左右滑动查看噢


为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。



推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。


以上是关于如何在Hue中配置Impala的负载均衡的主要内容,如果未能解决你的问题,请参考以下文章

如何使用HAProxy实现Impala的负载均衡

Hive/Impala--HAProxy实现Impala/HiveServer2负载均衡

如何使用Nginx实现Impala负载均衡

如何在Hue中调优Impala和Hive查询

如何使用 HUE 在 Impala 查询中设置变量?

nginx如何做到TCP的负载均衡