初识千万级高并发负载均衡软件HaProxy
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识千万级高并发负载均衡软件HaProxy相关的知识,希望对你有一定的参考价值。
什么是HaProxy?
负载均衡的实现方式一般有两种方式,硬件负载均衡和软件负载均衡,硬件负载均衡最具代表性的当属F5,软件负载均衡的实现方案很多,大致分为两类,一种为操作系统级的负载均衡,另一种为第三方应用的软件负载均衡。LVS就是基于操作系统的一种软件负载均衡,HaProxy和nginx等就是开源的基于第三方应用的软件负载均衡。
HaProxy是TCP / HTTP 反向代理服务器,尤其适合于高可用性环境。HAProxy 可以在4和7两层作负载均衡。它支持两种主要的代理模式:"tcp"也即4层(大多用于邮件服务器、内部协议通信服务器、mysql等),和7层HTTP的代理。在4层的代理模式下,haproxy仅在客户端和服务器之间进行流量转发。但是在7才能够http代理模式下,haproxy会分析应用层协议,并且能通过允许,拒绝,交换,增加,修改或者删除请求或者回应里指定内容来控制协议。
HaProxy的安装与配置
在红帽官方发行的Linux版本的镜像中以加入了haproxy的软件包。所以用户无需使用复杂的编译安装方式来安装该软件,可直接使用yum方式或者rpm方式安装haproxy
[[email protected] ~]# yum -y install haproxy #安装haproxy [[email protected] ~]# rpm -qi haproxy #查看软件信息 [[email protected] ~]# rpm -ql haproxy #查看软件的文件列表 |
安装完成后可使用如上命令来查看其信息和软件列表,其中三个文件构成器软件运行环境,即主程序,配置文件,服务启动脚本。配置文件为/etc/haproxy/haproxy.cfg。
Haproxy配置
Haproxy的配置文件总体分为两大段,全局配置段(global)和代理配置段(proxies)。
全局配置段:
主要配置进程及安全配置相关的参数性能调整相关参数和Debug的一些选项。这些参数一般只设置一次,如果配置无误,就不需要再次配置进行修改。
代理配置段下分为四个子配置段:
defaults :为frontend, backend,listen 提供默认配置
frontend :前端,相当于nginx 中的server {}段,用于接收请求的前端虚拟节点,Frontend可以根据规则直接指定具体使用后端的backend(可动态选择)
backend :后端,相当于nginx 中的upstream {}段,即后端服务集群的配置,是真实的服务器,一个Backend对应一个或者多个实体服务器
listen :同时拥有前端和后端,即frontend和backendde 组合体, 适用于一对一环境
配置文件详解:
全局配置段
global log 127.0.0.1 local2 #全局的日志配置其中日志级别是[err warning info debug],local2 是日志设备,但是之前在/etc/syslog.conf文件中定义的是local0所以这里也是用local2,同时支持把日志存放与远程的日志服务器中,需对日志服务进行陪孩子 chroot /var/lib/haproxy pidfile /var/run/haproxy.pid maxconn 4000 #默认最大连接数 user haproxy #运行haproxy的用户 group haproxy #运行haproxy的用户 daemon #使HAProxy进程进入后台运行(守护进程方式)。这是推荐的运行模式 nbproc 2 #要启动的haproxy 的进程数量,系统默认单进程,要求使用daemon maxconnrate <number> :设置每个进程每秒种所能建立的最大连接数量 maxsessrate <number> :设置每个进程每秒种所能建立的最大会话数量 maxsslconn <number>: 每进程支持SSL 的最大连接数量 spread-checks <0..50, in percent> 健康检测延迟时长比,建议2-5 之间 |
默认配置段
defaults mode http #默认使用http代理,做配置时注意 log global #使用全局默认日志配置 option httplog #采用http日志格式 option dontlognull option http-server-close option forwardfor except 127.0.0.0/8 option redispatch #如果cookie写入了serverId而客户端不会刷新cookie,当serverId对应的服务器挂掉后,强制定向到其他健康的服务器 retries 3 timeout http-request 10s #请求超时时间 timeout queue 1m timeout connect 10s #连接超时时间 timeout client 1m #客户端超时时间 timeout server 1m #服务端超时时间 timeout http-keep-alive 10s #持久连接超时时间 timeout check 10s #心跳检测超时时间 maxconn 3000 |
Frontend ,backend,listen配置选项详解:
Bind:指定一个或者多个前端侦听地址和端口,用于listen,Frontend段
示例:
listen http_proxy bind :80,:443 bind 10.0.0.1:10080,10.0.0.1:10443 bind /var/run/ssl-frontend.sock user root mode 600 accept-proxy |
Balance:后端服务器组内的调度算法,用于default, backend,listen段
用法:balance <algorithm> [<arguments> ]
balance url_param <param>[check_post]
调度算法种类:
roundrobin:基于权重轮询,动态算法,支持权重的运行时调整,支持慢启动;每个后端backend 中最多支持4095 个server
serveroptions:weight #
static-rr:基于权重轮询,静态算法,不支持权重的运行时调整及慢启动;后端主机数量无上限
leastconn:加权最少连接,动态算法,最少连接的后端服务器优先分配接收新连接,相同连接时轮询,推荐在较长会话的场景使用 ,例如MySQL 、LDAP 等,不适合http
first:根据服务器在列表中的位置,自上而下进行调度;前面服务器的连接数达到上限,新请求才会分配给下一台服务
source:源地址hash ,新连接先按权重分配,后续连接按source 分配请求
uri:对URI 的左半部分或整个uri 做hash 计算,并除以服务器总权重取模,以后派发至某挑出的服务器, 适用于后端缓存服务器
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
左半部分:/<path>;<params>
整个uri :/<path>;<params>?<query>#<frag>
url_param:对用户请求的uri 中的<params>部分中的参数的值作hash 计算,并由服务器总权重相除以后派发至某挑出的服务器;通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个Backend Server
hdr(<name>):对于每个http 请求,此处由<name> 指定的http 首部将会被取出做hash;计算; 并由服务器总权重相除以后派发至某挑出的服务器; 无 有效值的会被轮询调度
rdp-cookie 远程桌面相关
rdp-cookie(<name>)
hash-type :哈希算法,用于default,listen,backend配置段
hash-type <method> <function><modifier>
method:
map-based:除权取余法,哈希数据结构是静态数组
consistent:一致性哈希,哈希数据结构是一棵树
<function>: 哈希函数
sdbmdjb2 wt6
default_backend <backend>
无use_backend 匹配时,使用默认的backend,用于frontend中,或者defaults和listen中
default-server [param*]
为backend 中的各server设定默认选项,用于default,listen,backend配置段
server <name><address>[:[port]] [param*]
定义后端主机的各服务器及其选项,用于listen和backend中。
server <name> <address>[:port] [settings ...] default-server [settings ...] <name> :服务器在haproxy 上的内部名称;出现在日志及警告信息 <address> :服务器地址,支持使用主机名 [:[port]] :端口映射;省略时,表示同bind 中绑定的端口 [param*] :参数 weight <weight> :权重,默认为1 maxconn <maxconn> :当前后端server 的最大并发连接数 backlog <backlog> :当server 的连接数达到上限后的后援队列长度 backup :设定当前server 为备用服务器Sorry Server |
Haproxy的配置选项众多,不能详尽,读者可查看其官方文档进行学习。
https://cbonte.github.io/haproxy-dconv/
本文出自 “Keep simple keep stupid” 博客,请务必保留此出处http://yangzhiheng.blog.51cto.com/11586378/1979161
以上是关于初识千万级高并发负载均衡软件HaProxy的主要内容,如果未能解决你的问题,请参考以下文章
美团面试题:如何设计负载均衡架构支撑千万级用户的高并发访问?
千万级负载神器 LVSNginx及HAProxy工作原理大图详解!
美团面试题:如何设计负载均衡架构支撑千万级用户的高并发访问?