haproxy相关概念及原理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了haproxy相关概念及原理相关的知识,希望对你有一定的参考价值。

1、 Haproxy介绍

HaProxy是一个特别适用于高可用性环境的TCP/HTTP开源的反向代理和负载均衡软件。在七层负载均衡方面的功能很强大(支持cookie track,header rewrite等等),支持双机热备,支持虚拟主机,支持健康检查,同时还提供直观的监控页面,可以清晰的监控服务集群的运行状况。同时支持Linux2.6内核中System Epoll,通过简化系统调用,大幅的提高了网络I/O性能。

Haproxy包括以下一些特征:

  • 根据静态分配的cookie分配HTTP请求
  • 分配负载到各个服务器,同时保证服务器通过使用HTTP Cookie实现连接保持;
  • 当主服务器宕机时切换到备服务器,允许特殊端口的服务监控;
  • 做维护时通过配置可以保证业务的连续性,更加人性化;
  • 添加修改删除HTTP Request和Respone头;
  • 通过特定表达式Block HTTP请求;
  • 根据应用的cookie做连接保持;
  • 常有用户验证的详细的html监控报告。

1.1 Haproxy支持的平台

HaProxy可以运行在如下这些平台上:

  • Linux2.4 on x86,x86_64,Alpha,Sparc,MIPS,PARISC
  • Linux2.6/3.x on x86,x86_64,ARM,Sparc,PPC64
  • Solaris 8/9 on UltraSparc 2 and 3
  • Solaris 10 Opteron and UltraSPARC
  • FreeBSD 4.10 - 10 on x86
  • OpenBSD 3.1-current on i386,amd64,alpha,spare64 and VAX (check the ports)
  • AIX 5.1-5.3 on Power architechare

1.2 Haproxy负载均衡算法

HaProxy的负载均衡算法现在具体有如下8种:
1、 roundrobin:简单的轮询
2、 static-rr:权重轮询
3、 leastconn:最少连接者优先
4、 source:根据请求源IP,这个跟nginx的ip_hash机制类似
5、 ri:根据请求的URI
6、 rl_param:表示根据请求的URI参数‘balance url_param’requires an URL parameter name;
7、 hdr(name):根据HTTP请求头来锁定每一次HTTP请求
8、 rdp-cookie(name):根据cookie来锁定并哈希每一次TCP请求

2.HAPROXY的配置

HAProxy的配置过程分为3个主要部分:

  • 命令行参数,这是最优先的;
  • global(全局)段,设置进程级参数;
  • 代理配置段,通常位于default,listen,backend这样的形式内。
    配置文件的语法是由关键字后跟可选的一个或者多个参数(参数之间有空格)组成。如果字符串中包含空格,必须用’’进行转义。

HAPROXY配置中分五大部分:

  1. global:全局参数配置,进程级的,用来控制Haproxy启动前的一些进程及系统设置。
  2. defaults:配置一些默认的参数,可以被frontend,backend,listen段集成使用
  3. frontend:用来匹配接收客户所请求的域名,uri等,并针对不同的匹配,做不同的请求处理;
  4. backend:定义后端服务器集群,以及对后端服务器集群的一些权重、队列、连接数等选项的设置,类似于nginx中的upstream模块;
  5. listen:可以理解为frontend和backend的组合体。
    Haproxy配置文件的配置方法主要有两种,一种是由前端(frontend)和后端(backend)配置块组成,前端和后端都可以有多个。第二种方法是只有一个listen配置块来同时实现前端和后端。最常用也是推荐的方法为第一种,即frontend和backend的模式。

2.1 配置参数

配置参数及详解:

global                                                 # 全局参数global模块的设置
    log         127.0.0.1 local2                      # log语法:log <address_1>[max_level_1] # 全局的日志配置,使用log关键字,指定使用127.0.0.1上的syslog服务中的local0日志设备,记录日志等级为info的日志
    chroot      /var/lib/haproxy              #工作目录
    pidfile     /var/run/haproxy.pid          #进程pid文件
    maxconn     4000                          #最大连接数
    user        haproxy                       #所属用户
    group       haproxy                       #所属用户组
    daemon                                    #以守护进程方式运行haproxy
stats socket /var/lib/haproxy/stats       #定义socket套接字,针对在线维护很有帮助

defaults                                      # defaults模块的设置
    mode                    http              #默认的模式{ tcp|http|health},health只会返回OK
    log                     global            #应用全局的日志配置
    option                  httplog           #启用日志记录HTTP请求,默认不记录HTTP请求日志                                                                
    option                 dontlognull        # 启用该项,日志中将不会记录空连接。所谓空连接就是在上游的负载均衡器者监控系统为了探测该 服务是否存活可用时,需要定期的连接或者获取某一固定的组件或页面,或者探测扫描端口是否在监听或开放等动作被称为空连接;官方文档中标注,如果该服务上游没有其他的负载均衡器的话,建议不要使用该参数,因为互联网上的恶意扫描或其他动作就不会被记录下来
    option http-server-close                  #每次请求完毕后主动关闭http通道
    option forwardfor       except 127.0.0.0/8   #如果服务器上的应用程序想记录发起请求的客户端的IP地址,需要在HAProxy上配置此选项, 这样 HAProxy会把客户端的IP信息发送给服务器,在HTTP                                                                            请求中添加"X-Forwarded-For"字段。 启用  X-Forwarded-For,在requests                                                                            头部插入客户端IP发送给后端的server,使后端server获取到客户端的真实IP。 
    option                  redispatch       # 当使用了cookie时,haproxy将会将其请求的后端服务器的serverID插入到cookie中,以保证会话的SESSION持久性;而此时,如果后端的服务器宕掉                                                                            了, 但是客户端的cookie是不会刷新的,如果设置此参数,将会将客户的请                                                                            求强制定向到另外一个后端server上,以保证服务的正常。
    retries                 3              # 定义连接后端服务器的失败重连次数,连接失败次数超过此值后将会将对应后端服务器标记为不可用
    timeout http-request    10s             #http请求超时时间
    timeout queue           1m              #一个请求在队列里的超时时间
    timeout connect         10s             #连接超时
    timeout client          1m              #客户端超时
    timeout server          1m              #服务器端超时
    timeout http-keep-alive 10s             #设置http-keep-alive的超时时间
    timeout check           10s             #检测超时
maxconn                 3000            #每个进程可用的最大连接数

listen stats                                #定义一个listen模块,用于状态检测
mode http                               #模式采用http
bind 0.0.0.0:8888                       #绑定本机的地址及端口
stats enable                            #启用状态检测功能
stats uri     /haproxy-status           #状态检测的URI
stats auth    haproxy:123456            #访问检测界面的用户名和密码

frontend  main *:80                         #frontend模块的设置,定义了一个前端
    acl url_static       path_beg       -i /static /images /javascript /stylesheets
    acl url_static       path_end       -i .jpg .gif .png .css .js      #这里定义了一个acl规则
    use_backend static   if  url_static     #如果匹配到了acl,则访问后端的static模块
default_backend             my_webserver #如果没有匹配到acl,则将请求丢给默认的模块

backend static                          #定义第一个后端模块,static
    balance     roundrobin              #负载均衡算法为轮询
server      static 127.0.0.1:80 check         #后端服务器地址

backend my_webserver                    #定第二个后端,my_wenserver
balance     roundrobin              #负载均衡算法
    server  web01 172.31.2.33:80  check inter 2000 fall 3 weight 30              #定义的多个后端
    server  web02 172.31.2.34:80  check inter 2000 fall 3 weight 30              #定义的多个后端
    server  web03 172.31.2.35:80  check inter 2000 fall 3 weight 30              #定义的多个后端

2.2 健康检查

Haproxy作为Loadblance,支持对backend的健康检查,以保证在后端backend不能服务时,把从frontend进来的request分配至其他可以服务的backend,从而保证整体服务的可用性。

2.2.1 相关配置

相关配置:

httpchk <method><uri><version>
option httpchk HEAD / HTTP/1.0
check:启动健康检测
inter:健康检测时间间隔
rise:检测服务可用的连接次数
fall:检测服务不可用的连接次数
error-limit:往server写数据连续失败次数的上限,执行on-error的设定
observe<mode>:把正常服务过程作为健康检测请求,即实时检测
on-error<mode>:满足error-limit后执行的操作(fastinter、fail-check、sudden-death、mark-down)。其中fastinter表示立即按照fastinter的检测延时进行。fail-check表示改次error作为一次检测;sudden-death表示模仿一次fatal,如果紧接着一次fail则server为down;mark-down表示直接把server设置为down状态。
server web-node2 192.168.56.22:8080 check inter 2000 rise 30 fall 15

2.2.2检测方式

3.3.2 检测方式
1、通过监听端口进行健康检测
这种检测方式,haproxy只会去检查server的端口,并不能保证服务真正可用。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

2、通过URI进行健康检测
这种检测方式,是用去GET后端server的web页面,基本可以代表后端服务的可用性。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk GET /index.html
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

3、通过request获取的头部信息进行匹配进行健康检测
这种检测方式,是基于一些高级、精细的监测需求,通过对后端头部访问的头部信息进行匹配检测。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk HEAD /index.jsp HTTP/1.1 Host:www.xxx.com
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

以上是关于haproxy相关概念及原理的主要内容,如果未能解决你的问题,请参考以下文章

锁的概念及synchronized使用原理解析

Redis的主从复制哨兵模式以及群集模式(相关概念及实验详解)

第二章--Win32程序运行原理 (部分概念及代码讲解)

Linux库概念及相关编程(面试重点)

zabbix--基础概念及原理

zabbix--基础概念及原理