初识千万级高并发负载均衡软件HaProxy

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识千万级高并发负载均衡软件HaProxy相关的知识,希望对你有一定的参考价值。

什么是HaProxy?


负载均衡的实现方式一般有两种方式,硬件负载均衡和软件负载均衡,硬件负载均衡最具代表性的当属F5,软件负载均衡的实现方案很多,大致分为两类,一种为操作系统级的负载均衡,另一种为第三方应用的软件负载均衡。LVS就是基于操作系统的一种软件负载均衡,HaProxy和nginx等就是开源的基于第三方应用的软件负载均衡。

    HaProxy是TCP / HTTP 反向代理服务器,尤其适合于高可用性环境。HAProxy 可以在4和7两层作负载均衡。它支持两种主要的代理模式:"tcp"也即4层(大多用于邮件服务器、内部协议通信服务器、mysql等),和7层HTTP的代理。在4层的代理模式下,haproxy仅在客户端和服务器之间进行流量转发。但是在7才能够http代理模式下,haproxy会分析应用层协议,并且能通过允许,拒绝,交换,增加,修改或者删除请求或者回应里指定内容来控制协议。

HaProxy的安装与配置


  在红帽官方发行的Linux版本的镜像中以加入了haproxy的软件包。所以用户无需使用复杂的编译安装方式来安装该软件,可直接使用yum方式或者rpm方式安装haproxy

[[email protected]  ~]# yum -y install haproxy  #安装haproxy

[[email protected]  ~]# rpm -qi haproxy #查看软件信息

[[email protected]  ~]# rpm -ql haproxy  #查看软件的文件列表

    安装完成后可使用如上命令来查看其信息和软件列表,其中三个文件构成器软件运行环境,即主程序,配置文件,服务启动脚本。配置文件为/etc/haproxy/haproxy.cfg

Haproxy配置

Haproxy的配置文件总体分为两大段,全局配置段(global)和代理配置段(proxies)。

全局配置段:

主要配置进程及安全配置相关的参数性能调整相关参数和Debug的一些选项。这些参数一般只设置一次,如果配置无误,就不需要再次配置进行修改。

代理配置段下分为四个子配置段:

defaults :为frontend, backend,listen 提供默认配置

frontend :前端,相当于nginx 中的server {}段,用于接收请求的前端虚拟节点,Frontend可以根据规则直接指定具体使用后端的backend(可动态选择)

backend :后端,相当于nginx 中的upstream {}段,即后端服务集群的配置,是真实的服务器,一个Backend对应一个或者多个实体服务器

listen :同时拥有前端和后端,即frontend和backendde 组合体, 适用于一对一环境

配置文件详解:

全局配置段

global

   log         127.0.0.1 local2 #全局的日志配置其中日志级别是[err warning  info debug],local2 是日志设备,但是之前在/etc/syslog.conf文件中定义的是local0所以这里也是用local2,同时支持把日志存放与远程的日志服务器中,需对日志服务进行陪孩子

   chroot      /var/lib/haproxy

   pidfile     /var/run/haproxy.pid

   maxconn     4000    #默认最大连接数

   user        haproxy  #运行haproxy的用户

   group       haproxy   #运行haproxy的用户

daemon    #使HAProxy进程进入后台运行(守护进程方式)。这是推荐的运行模式

nbproc  2  #要启动的haproxy 的进程数量,系统默认单进程,要求使用daemon

maxconnrate <number>  :设置每个进程每秒种所能建立的最大连接数量

maxsessrate <number>  :设置每个进程每秒种所能建立的最大会话数量

maxsslconn  <number>:  每进程支持SSL 的最大连接数量

spread-checks <0..50,  in percent>  健康检测延迟时长比,建议2-5 之间

默认配置段

defaults

    mode                    http     #默认使用http代理,做配置时注意

    log                     global   #使用全局默认日志配置

    option                  httplog  #采用http日志格式

    option                  dontlognull

    option http-server-close

    option forwardfor       except 127.0.0.0/8

    option                  redispatch  #如果cookie写入了serverId而客户端不会刷新cookie,当serverId对应的服务器挂掉后,强制定向到其他健康的服务器

    retries                 3

    timeout http-request    10s   #请求超时时间

    timeout queue           1m

    timeout connect         10s   #连接超时时间

    timeout client          1m   #客户端超时时间

    timeout server          1m   #服务端超时时间

    timeout http-keep-alive 10s   #持久连接超时时间

    timeout check           10s   #心跳检测超时时间

    maxconn                 3000

Frontend ,backend,listen配置选项详解:

Bind:指定一个或者多个前端侦听地址和端口,用于listen,Frontend段

 

示例:

listen  http_proxy

    bind :80,:443

    bind 10.0.0.1:10080,10.0.0.1:10443

    bind /var/run/ssl-frontend.sock user root  mode 600 accept-proxy

Balance后端服务器组内的调度算法,用于default, backend,listen段

用法:balance <algorithm> [<arguments> ]

    balance url_param <param>[check_post]

调度算法种类:

   roundrobin基于权重轮询,动态算法,支持权重的运行时调整,支持慢启动;每个后端backend 中最多支持4095 个server

       serveroptionsweight #

   static-rr基于权重轮询,静态算法,不支持权重的运行时调整及慢启动;后端主机数量无上限

   leastconn加权最少连接,动态算法,最少连接的后端服务器优先分配接收新连接,相同连接时轮询,推荐在较长会话的场景使用 ,例如MySQL 、LDAP 等,不适合http

   first根据服务器在列表中的位置,自上而下进行调度;前面服务器的连接数达到上限,新请求才会分配给下一台服务

   source源地址hash ,新连接先按权重分配,后续连接按source 分配请求

       uri对URI 的左半部分或整个uri 做hash 计算,并除以服务器总权重取模,以后派发至某挑出的服务器, 适用于后端缓存服务器

<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>

左半部分:/<path>;<params>

整个uri /<path>;<params>?<query>#<frag>

   url_param对用户请求的uri 中的<params>部分中的参数的值作hash 计算,并由服务器总权重相除以后派发至某挑出的服务器;通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个Backend Server

   hdr(<name>)对于每个http 请求,此处由<name> 指定的http 首部将会被取出做hash;计算;  并由服务器总权重相除以后派发至某挑出的服务器; 无 有效值的会被轮询调度

   rdp-cookie  远程桌面相关

   rdp-cookie(<name>)

hash-type 哈希算法,用于default,listen,backend配置段

hash-type <method> <function><modifier>

       method:

       map-based除权取余法,哈希数据结构是静态数组

       consistent一致性哈希,哈希数据结构是一棵树

       <function>:  哈希函数

              sdbmdjb2 wt6

 

default_backend <backend>

无use_backend  匹配时,使用默认的backend,用于frontend中,或者defaults和listen中

default-server [param*] 

为backend 中的各server设定默认选项,用于default,listen,backend配置段

 

server <name><address>[:[port]] [param*]

       定义后端主机的各服务器及其选项,用于listen和backend中。

server  <name> <address>[:port] [settings ...]

default-server  [settings ...]

<name>  :服务器在haproxy 上的内部名称;出现在日志及警告信息

<address>  :服务器地址,支持使用主机名

[:[port]]  :端口映射;省略时,表示同bind 中绑定的端口

[param*]  :参数

weight  <weight> :权重,默认为1

maxconn  <maxconn> :当前后端server 的最大并发连接数

backlog  <backlog> :当server 的连接数达到上限后的后援队列长度

backup  :设定当前server 为备用服务器Sorry Server

 

Haproxy的配置选项众多,不能详尽,读者可查看其官方文档进行学习。

https://cbonte.github.io/haproxy-dconv/


本文出自 “Keep simple keep stupid” 博客,请务必保留此出处http://yangzhiheng.blog.51cto.com/11586378/1979161

以上是关于初识千万级高并发负载均衡软件HaProxy的主要内容,如果未能解决你的问题,请参考以下文章

美团面试题:如何设计负载均衡架构支撑千万级用户的高并发访问?

千万级负载神器 LVSNginx及HAProxy工作原理大图详解!

千万级流量架构下的负载均衡解析

美团面试题:如何设计负载均衡架构支撑千万级用户的高并发访问?

美团面试题:如何设计负载均衡架构支撑千万级用户的高并发访问?

千万级流量架构下的负载均衡解析