如何使用HAProxy实现Impala的负载均衡

Posted Hadoop实操

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用HAProxy实现Impala的负载均衡相关的知识,希望对你有一定的参考价值。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


1.文档编写目的



前面Fayson介绍过《》,正如之前所说Cloudera官网推荐并支持的负载均衡为HAProxy。所以Fayson就介绍一下如何使用HAProxy实现Impala服务的负载均衡。


  • 内容概述

1.HAProxy安装及启停

2.HAProxy配置Impala负载均衡

3.Impala shell及JDBC测试


  • 测试环境

1.CM和CDH版本为5.13.0

2.采用root用户操作

3.集群未启用Kerberos

4.HAProxy1.5.18


2.HAProxy安装及启停



1.在集群中选择一个节点,使用yum方式安装HAProxy服务

[root@ip-172-31-9-33 ~]# yum -y install haproxy


2.启动与停止HAProxy服务,并将服务添加到自启动列表

[root@ip-172-31-9-33 ~]# service haproxy start
[root@ip-172-31-9-33 ~]# service haproxy stop
[root@ip-172-31-9-33 ~]# chkconfig haproxy on

如何使用HAProxy实现Impala的负载均衡

如何使用HAProxy实现Impala的负载均衡


3.HAProxy配置Impala负载均衡



1./etc/haproxy目录下的haproxy.cfg文件备份,新建haproxy.cfg文件,添加如下配置

#---------------------------------------------------------------------
# Example configuration for a possible web application.  See the
# full configuration options online.
#
#   http://haproxy.1wt.eu/download/1.4/doc/configuration.txt
#
#---------------------------------------------------------------------

#---------------------------------------------------------------------
# Global settings
#---------------------------------------------------------------------
global
    log        
127.0.0.1 local2

   
chroot      /var/lib/haproxy
   
pidfile     /var/run/haproxy.pid
   
maxconn     4000
   
user        haproxy
   
group       haproxy
   
daemon

   
# turn on stats unix socket
   
stats socket /var/lib/haproxy/stats

#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------
defaults
    mode                   
http
   
log                     global
   
option                  httplog
   
option                  dontlognull
   
#option http-server-close
    #option forwardfor       except 127.0.0.0/8
   
option                  redispatch
   
retries                 3
   
timeout http-request    10s
   
timeout queue           1m
   
timeout connect         10s
   
timeout client          1m
   
timeout server          1m
   
timeout http-keep-alive 10s
   
timeout check           10s
   
maxconn                 3000


listen stats
   
bind 0.0.0.0:1080
   
mode http
   
option httplog
   
maxconn 5000
   
stats refresh 30s
   
stats  uri /stats

listen impalashell
   
bind 0.0.0.0:25003
   
mode tcp
   
option tcplog
   
balance leastconn
   
server ip-172-31-9-33.fayson.com ip-172-31-9-33.fayson.com:21000 check
   
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21000 check
   
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21000 check

listen impalajdbc
   
bind 0.0.0.0:25004
   
mode tcp
   
option tcplog
   
balance leastconn
   
server ip-172-31-9-33.fayson.com ip-172-31-9-33.fayson.com:21050 check
   
server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21050 check
   
server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21050 check

如何使用HAProxy实现Impala的负载均衡

主要配置了HAProxyhttp状态管理界面、impalashellimpalajdbc的负载均衡。


2.重启HAProxy服务

[root@ip-172-31-9-33 haproxy]# service haproxy restart

如何使用HAProxy实现Impala的负载均衡


3.浏览器访问http://{hostname}:1080/stats

如何使用HAProxy实现Impala的负载均衡

看到以上截图说明,已成功配置了Impala服务的负载均衡。


4.Impala Shell测试



使用多个终端同时访问,并执行SQL语句,查看是否会通过HAProxy服务自动负载到其它Impala Daemon节点


1.使用Impala shell访问HAProxy服务的25003端口,命令如下

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003

 

2.打开第一个终端访问并执行SQL

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003
...
[ip-172-31-9-33.fayson.com:25003] > select * from my_first_table;
...
+----+------+
| id | name |
+----+------+
| | john |
|
| tom  |
|
| jim  |
+----+------+
Fetched
3 row(s) in 7.20s
[ip-172-31-9-33.fayson.com:25003] >

如何使用HAProxy实现Impala的负载均衡


3.同时打开第二个终端访问并执行SQL

[root@ip-172-31-6-148 ~]# impala-shell -i ip-172-31-9-33.fayson.com:25003
...
[ip-172-31-9-33.fayson.com:25003] > select * from my_first_table;
...
+----+------+
| id | name |
+----+------+
| | tom  |
|
| jim  |
|
| john |
+----+------+
Fetched
3 row(s) in 1.81s
[ip-172-31-9-33.fayson.com:25003] >

如何使用HAProxy实现Impala的负载均衡

通过以上测试可以看到,两个终端执行的SQL不在同一个Impala Daemon,这样就实现了Impala Daemon服务的负载均衡。


5.Impala JDBC测试



这里Java的测试工程就不详细描述如何创建了,前面的文章Fayson也有讲过。

如何使用HAProxy实现Impala的负载均衡


2.运行代码,查看运行结果



为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。




您可能还想看


安装










安全









数据科学













其他










推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。


以上是关于如何使用HAProxy实现Impala的负载均衡的主要内容,如果未能解决你的问题,请参考以下文章

如何使用Nginx实现Impala负载均衡

haproxy反代负载均衡

如何在Hue中配置Impala的负载均衡

Impala负载均衡方案-HAProxy

使用haproxy-实现七层负载均衡

使用haproxy-实现七层负载均衡