你不想了解吗?亲!又一负载均衡!haproxy代理服务器!

Posted 龙少。

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了你不想了解吗?亲!又一负载均衡!haproxy代理服务器!相关的知识,希望对你有一定的参考价值。

一.Haproxy前言

Haproxy是一个使用c语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TOP和HTT的应用程序代理。

Haproxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。Haproxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中,同时可以保护你的web服务器不被暴露到公共网络上。

Haproxy实现了一种事件驱动,单一进程模型,此模型支持非常大的并发连接数。多进程或多线程模型受内存限制系统调度器限制以及无处不在的锁限制,很少能处理数千并发连接。
事件驱动模型因为在有更好的资源和时间管理的用户空间(User-Space)实现所有这些任务,所以没有这些问题。

此模型的弊端是,在多核系统上,这些程序通常扩展性较差。这就是为什么他们必须进行优化以使每个CPU时间片(cycle)做更多的工作。

包括GitHub,Bitbucket,stack overflow,Reddit Tumblr,Twitter 和 Tuenti在内的知名网站,及亚马逊网络服务系统都便用了Haproxy

二.haproxy简介

1.常见的web集群调度器

目前常见的web集群调度器分为软件和硬件
软件通常使用开源的LVS、 Haproxy、nginx

LVS性能最好,但是搭建相对复杂;Nginx的upstream模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有Haproxy好。

硬件一般使用比较多的是F5,也有很多人使用国内的一些产品,如梭子鱼、绿盟等

2.Haproxy应用分析

①LVS在企业应用中抗负载能力很强,但存在不足
②LVS不支持正则处理,不能实现动静分离
③对于大型网站,LVS的实施配置复杂,维护成本相对较高

Haproxy是一款可提供高可用性、负载均衡、及基于TCP和HTTP应用的代理的软件适用于负载大的web站点运行在硬件上可支持数以万计的并发连接的连接请求

3.Haproxy高性能负载均衡的主要优点:

①Haproxy在负载均衡速度和并发处理上是优于Nginx

②Haproxy支持虚拟主机,可以工作在四,七层

③能够补充Nginx (以ip_hash的方式)的一些缺点,比如session的保持、Cookie的引导等工作

④支持以url的方式检测后端的服务器的状态

⑤Haproxy可以对mysql进行负载均衡,对后端的DB节点进行检测和负载均衡

⑥支持很多负载均衡算法(丰富),Round-robin (轮询) 、weight-round-robin(加权轮询)、source hashing(原地址保持)、RI(请求URL) 、 rdp-cookie(根据cookie)

4.四层与七层负载的主要区别

四层负载均衡器是通过分析IP层及"TCP/UDP"层的流量实现的基于"IP+端口”的负载均衡,主要通过报文的目标地址和端口配合负载均衡算法选择后端真实服务器,确定是否需要对报文进行修改(根据需求,可能会修改目标地址、源地址、MAC地址等)并将数据转发至选出的后端真实服务器。

七层负载均衡器是基于应用层信息(如URL、Cookies等)的负载均衡。主要依据报文的内容配合负载均衡算法选择后端真实服务器,然后再分发请求到真实服务器进行处理,也称"内容交换器"。客户端与负载均衡器、负载均衡器与后端真实服务器之间会分别建立TCP连接。

三.haproxy调度算法原理

Haproxy支持多种调度算法,最常用的有三种

1.RR (Round Robin):轮询调度

举例:有2个节点a、b
第一个用户访问会被指派的节点是a
第二个用户访问会被指派的节点是b
第三个用户访问会被指派的节点是a
循环往复

2.LC (Least|Connections):最小连接数算法,根据后端的节点连接数大小动态分配前端请求

举例:有三个节点a、b、c,连接数分别为1、2、3
第一个用户连接请求时,会被指派到a上,连接数变为2、2、3
第二个用户请求会继续分配给a,连接数变为3、2、3
第三个用户连接请求时,会分配给b
以此类推

3.SH (Source Hashing):基于来源访问调度算法,用于一些有Session会话记录在服务器端的场景,可以基于来源的IP、Cookie等做集群调度

举例:有三个节点a、b、c
第一个用户第一次访问被指派到了a,第二个用户第一次访问被指派到了b
第一个用户第二次访问会被继续指派到a,第二个用户第二次访问时依旧会被指派到b
只要负载均衡调度器不重启,第一个用户访问都会被指派到a,第二个用户访问都会被指派到b,永远轮不到c

四.nginx和LVS、 Haproxy的区别

nginx
支持正则
只支持基于端C1的健康检查
不支持session的直接保持,但能通过IP_ hash来解决
对网络稳定性要求不高
反向代理能力强
nginx社区活跃( 社区:维护、更新服务的组织)、收费社区

LVS
只能基于四层端口转发
在四层做分发作用,抗负载能力强
应用范围广(几乎可以对所有应用做负载)

Haproxy .
支持8种负载均衡策略
仅做负载均衡软件使用,在高并发情况下性能优于nginx
支持URL健康检测、支持session保持

五.部署Haproxy服务器

1.实验环境准备

4台服务器,1台Haproxy,2台nginx服务器,1台win10 客户端

Haproxy:192.168.206.166
nginx1:192.168.206.177
nginx2:192.168.206.188

每台服务器做时间同步
ntpdate ntp1.aliyun.com

2.Haproxy服务器编译安装配置

(1)安装依赖环境

[root@localhost ~]# hostnamectl set-hostname haproxy
[root@localhost ~]# su
[root@haproxy ~]# yum install -y pcre-devel bzip2-devel gcc gcc-c++ make

(2)查看内核版本

// An highlighted block
var foo = 'bar';

(3)下载tar包解压编译安装

[root@haproxy ~]# cd /opt
[root@haproxy opt]# ls
haproxy-1.5.19.tar.gz  rh
[root@haproxy opt]# tar zxvf haproxy-1.5.19.tar.gz

[root@haproxy opt]# ls
haproxy-1.5.19  haproxy-1.5.19.tar.gz  rh
[root@haproxy opt]# cd haproxy-1.5.19/
[root@haproxy haproxy-1.5.19]# make TARGET=linux2628 ARCH=x86_64

[root@haproxy haproxy-1.5.19]# make install

(4)配置文件

[root@haproxy haproxy-1.5.19]# mkdir /etc/haproxy
[root@haproxy haproxy-1.5.19]# cp examples/haproxy.cfg /etc/haproxy/
[root@haproxy haproxy-1.5.19]# cd /etc/haproxy/
[root@haproxy haproxy]# ls
haproxy.cfg
[root@haproxy haproxy]# vim haproxy.cfg

global

#4~5行–修改,配置日志记录,local0为日志设备,默认存放到系统日志
log /dev/log   local0 info		
log /dev/log   local0 notice
#log loghost    local0 info
maxconn 4096					#最大连接数,需考虑ulimit -n限制

#8行–注释,chroot(改变根目录),为该服务自设置的根目录,一般需将此行注释掉
#chroot /usr/share/haproxy
uid 99							#用户UID
gid 99							#用户GID
daemon							#守护进程模式

defaults        
log     global					#定义日志为global配置中的日志定义
mode    http					#模式为http
option  httplog					#采用http日志格式记录日志
option  dontlognull				#不记录健康检查日志信息
retries 3						#检查节点服务器失败次数,连续达到三次失败,则认为节点不可用
redispatch						#当服务器负载很高时,自动结束当前队列处理比较久的连接
maxconn 2000					#最大连接数
contimeout      5000			#连接超时时间
clitimeout      50000			#客户端超时时间
srvtimeout      50000			#服务器超时时间

listen  webcluster 0.0.0.0:80		
    option httpchk GET /test.html	#检查服务器的test.html文件
    balance roundrobin				#负载均衡调度算法使用轮询算法roundrobin
    server inst1 192.168.206.177:80 check inter 2000 fall 3		#定义在线节点
    server inst2 192.168.206.188:80 check inter 2000 fall 3

说明:
balance roundrobin #负载均衡调度算法
#轮询算法:roundrobin;最小连接数算法:leastconn;来源访问调度算法:source hashing,
类似于nginx的ip_hash
check inter 2000 #表示haproxy服务器和节点之间的一个心跳频率
fall 3 #表示连续三次检测不到心跳频率则认为该节点失效
若节点配置后带有“backup”表示该节点只是个备份节点,只有主节点失效该节点才会上。不携带“backup”,表示为主节点,和其它主节点共同提供服务。

(5)启动服务

[root@haproxy haproxy]# cp /opt/haproxy-1.5.19/examples/haproxy.init /etc/init.d/haproxy
[root@haproxy haproxy]# cd /etc/init.d/
[root@haproxy init.d]# ls
functions  haproxy  netconsole  network  README
[root@haproxy init.d]# chmod +x haproxy
[root@haproxy init.d]# ls
functions  haproxy  netconsole  network  README
[root@haproxy init.d]# chkconfig --add /etc/init.d/haproxy
[root@haproxy init.d]# ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy
[root@haproxy init.d]# service haproxy start
Starting haproxy (via systemctl):                          [  确定  ]
[root@haproxy init.d]#

3.两台nginx服务器编译安装配置

(1)依赖环境

[root@localhost ~]# hostnamectl set-hostname nginx1
[root@localhost ~]# su

[root@nginx1 ~]# yum install -y pcre-devel zlib-devel gcc gcc-c++ make

(2)创建用户

[root@nginx1 ~]# useradd -M -s /sbin/nologin nginx

(3)解压服务编译配置

[root@nginx1 ~]# cd /opt
[root@nginx1 opt]# ls
nginx-1.12.2.tar.gz  rh
[root@nginx1 opt]# tar zxvf nginx-1.12.2.tar.gz -C /opt/

[root@nginx1 opt]# ls
nginx-1.12.2  nginx-1.12.2.tar.gz  rh
[root@nginx1 opt]# cd nginx-1.12.2/
[root@nginx1 nginx-1.12.2]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx

[root@nginx1 nginx-1.12.2]# make && make install

(4)路径优化软链接

[root@nginx1 nginx-1.12.2]# ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/

(5)启动服务

[root@nginx1 nginx-1.12.2]# nginx

以上5步骤,2台nginx服务器配置相同

(6)写测试页面

[root@nginx1 nginx-1.12.2]# echo "this is jjj web" > /usr/local/nginx/html/test.html

[root@nginx2 nginx-1.12.2]# echo "this is kkk web" > /usr/local/nginx/html/test.html

4.win10 网页验证

访问192.168.206.166/test.html

刷新网页

六.日志管理

1.修改Haproxy配置文件中关于日志配置的选项,加入配置
log /dev/1oq loac10 info
log /dev/ log 1oca10 notice

2.修改rsyslog配置,将haproxy相关配置独立定义到haproxy.conf, 并放到/etc/rsyslog.d/下

3.保存配置文件并重启rsyslog服务,完成rsyslog配置

七.参数优化

随着企业网站负载增加,haproxy参数优化相当重要,具体的优化项如下:

maxconn: 最大连接数,根据应用实际情况进行调整,推荐使用10 240

daemon: 守护进程模式;Haproxy可以使用非守护进程模式启动,建议使用守护进程模式启动

nbproc:负载均衡的并发进程数,建议与当前服务器CPU核数相等或为其2倍

retries: 重试次数,主要用于对集群节点的检查,如果节点多,且并发量大,设置为2次或3次

option http-server-close: 主动关闭http请求选项, 建议在生产环境中使用此选项

timeouthttp-keep-alive:长连接超时时间,设置长连接超时时间,可以设置为10s

Limeoul http-requesL: hLLp请求超时时问,建议将此时问设置为5-~10s, 增加http连接释放速度

timcout. clicnt: 客户端超时时间,如果访问量过大,节点响应慢,可以将此时间设置短一 些,建议设置为1min左右就可以了

八.总结

这里主要介绍了haproxy服务器的部署

小结:
常见的web集群调度器分为软件和硬件

LVs性能最好,但是搭建相对复杂;Nginx的upstream模块支持群集功能,但是对群集节点健康检查功能不强,高并发性能没有Haproxy好

Haproxy是一款可提供高可用性、 负载均衡、及基于TCP和HTTP应用的代理的软件

最常用的调度算法有三种:RR:轮询调度;LC:最小连接数算法;SH:基于来源访问调度算法

负载均衡:
如果是中小型的 web应用,比如日PV小于1000万,用 Nginx就完全可以了;如果机器不少,可以用DNS轮询,IVS所耗费的机器还是比较多的;大型网站或重要的服务,且服务器比较多时,可以考虑用LVS。

以上是关于你不想了解吗?亲!又一负载均衡!haproxy代理服务器!的主要内容,如果未能解决你的问题,请参考以下文章

HAProxy配置为代理与负载均衡器之实践

Neutron社区每周记(11.28-12.2)| HAProxy 里的那些事儿

三大主流(LVSNginxHAproxy)负载均衡对比,你了解吗?

HAProxy 代理负载均衡

haproxy负载均衡代理服务详解

HAproxy负载均衡