初识千万级高并发负载均衡软件HaProxy

Posted 2020-10-13

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了初识千万级高并发负载均衡软件HaProxy相关的知识，希望对你有一定的参考价值。

什么是HaProxy？

负载均衡的实现方式一般有两种方式，硬件负载均衡和软件负载均衡，硬件负载均衡最具代表性的当属F5，软件负载均衡的实现方案很多，大致分为两类，一种为操作系统级的负载均衡，另一种为第三方应用的软件负载均衡。LVS就是基于操作系统的一种软件负载均衡，HaProxy和nginx等就是开源的基于第三方应用的软件负载均衡。

HaProxy是TCP / HTTP 反向代理服务器，尤其适合于高可用性环境。HAProxy 可以在4和7两层作负载均衡。它支持两种主要的代理模式:"tcp"也即4层（大多用于邮件服务器、内部协议通信服务器、mysql等），和7层HTTP的代理。在4层的代理模式下，haproxy仅在客户端和服务器之间进行流量转发。但是在7才能够http代理模式下，haproxy会分析应用层协议，并且能通过允许，拒绝，交换，增加，修改或者删除请求或者回应里指定内容来控制协议。

HaProxy的安装与配置

在红帽官方发行的Linux版本的镜像中以加入了haproxy的软件包。所以用户无需使用复杂的编译安装方式来安装该软件，可直接使用yum方式或者rpm方式安装haproxy

[[email protected] ~]# yum -y install haproxy #安装haproxy

[[email protected] ~]# rpm -qi haproxy #查看软件信息

[[email protected] ~]# rpm -ql haproxy #查看软件的文件列表

安装完成后可使用如上命令来查看其信息和软件列表，其中三个文件构成器软件运行环境，即主程序，配置文件，服务启动脚本。配置文件为/etc/haproxy/haproxy.cfg。

Haproxy配置

Haproxy的配置文件总体分为两大段，全局配置段（global）和代理配置段（proxies）。

全局配置段:

主要配置进程及安全配置相关的参数性能调整相关参数和Debug的一些选项。这些参数一般只设置一次，如果配置无误，就不需要再次配置进行修改。

代理配置段下分为四个子配置段：

defaults ：为frontend, backend,listen 提供默认配置

frontend ：前端，相当于nginx 中的server {}段，用于接收请求的前端虚拟节点，Frontend可以根据规则直接指定具体使用后端的backend(可动态选择)

backend ：后端，相当于nginx 中的upstream {}段，即后端服务集群的配置，是真实的服务器，一个Backend对应一个或者多个实体服务器

listen ：同时拥有前端和后端,即frontend和backendde 组合体，适用于一对一环境

配置文件详解：

全局配置段

global

log 127.0.0.1 local2 #全局的日志配置其中日志级别是[err warning info debug]，local2 是日志设备，但是之前在/etc/syslog.conf文件中定义的是local0所以这里也是用local2，同时支持把日志存放与远程的日志服务器中，需对日志服务进行陪孩子

chroot /var/lib/haproxy

pidfile /var/run/haproxy.pid

maxconn 4000 #默认最大连接数

user haproxy #运行haproxy的用户

group haproxy #运行haproxy的用户

daemon #使HAProxy进程进入后台运行（守护进程方式）。这是推荐的运行模式

nbproc 2 #要启动的haproxy 的进程数量，系统默认单进程，要求使用daemon

maxconnrate <number> ：设置每个进程每秒种所能建立的最大连接数量

maxsessrate <number> ：设置每个进程每秒种所能建立的最大会话数量

maxsslconn <number>: 每进程支持SSL 的最大连接数量

spread-checks <0..50, in percent> 健康检测延迟时长比，建议2-5 之间

默认配置段

defaults

mode http #默认使用http代理,做配置时注意

log global #使用全局默认日志配置

option httplog #采用http日志格式

option dontlognull

option http-server-close

option forwardfor except 127.0.0.0/8

option redispatch #如果cookie写入了serverId而客户端不会刷新cookie，当serverId对应的服务器挂掉后，强制定向到其他健康的服务器

retries 3

timeout http-request 10s #请求超时时间

timeout queue 1m

timeout connect 10s #连接超时时间

timeout client 1m #客户端超时时间

timeout server 1m #服务端超时时间

timeout http-keep-alive 10s #持久连接超时时间

timeout check 10s #心跳检测超时时间

maxconn 3000

Frontend ，backend,listen配置选项详解：

Bind:指定一个或者多个前端侦听地址和端口，用于listen，Frontend段

示例：

listen http_proxy

bind :80,:443

bind 10.0.0.1:10080,10.0.0.1:10443

bind /var/run/ssl-frontend.sock user root mode 600 accept-proxy

Balance：后端服务器组内的调度算法，用于default, backend,listen段

用法：balance <algorithm> [<arguments> ]

balance url_param <param>[check_post]

调度算法种类：

roundrobin：基于权重轮询,动态算法,支持权重的运行时调整，支持慢启动；每个后端backend 中最多支持4095 个server

serveroptions：weight #

static-rr：基于权重轮询，静态算法，不支持权重的运行时调整及慢启动；后端主机数量无上限

leastconn：加权最少连接，动态算法，最少连接的后端服务器优先分配接收新连接，相同连接时轮询，推荐在较长会话的场景使用，例如MySQL 、LDAP 等，不适合http

first：根据服务器在列表中的位置，自上而下进行调度；前面服务器的连接数达到上限，新请求才会分配给下一台服务

source：源地址hash ，新连接先按权重分配，后续连接按source 分配请求

uri：对URI 的左半部分或整个uri 做hash 计算，并除以服务器总权重取模，以后派发至某挑出的服务器, 适用于后端缓存服务器

左半部分：/<path>;<params>

整个uri ：/<path>;<params>?<query>#<frag>

url_param：对用户请求的uri 中的<params>部分中的参数的值作hash 计算，并由服务器总权重相除以后派发至某挑出的服务器；通常用于追踪用户，以确保来自同一个用户的请求始终发往同一个Backend Server

hdr(<name>)：对于每个http 请求，此处由<name> 指定的http 首部将会被取出做hash；计算；并由服务器总权重相除以后派发至某挑出的服务器；无有效值的会被轮询调度

rdp-cookie 远程桌面相关

rdp-cookie(<name>)

hash-type ：哈希算法，用于default,listen,backend配置段

hash-type <method> <function><modifier>

method:

map-based：除权取余法，哈希数据结构是静态数组

consistent：一致性哈希，哈希数据结构是一棵树

<function>: 哈希函数

sdbmdjb2 wt6

default_backend <backend>

无use_backend 匹配时，使用默认的backend，用于frontend中，或者defaults和listen中

default-server [param*]

为backend 中的各server设定默认选项，用于default,listen,backend配置段

server <name><address>[:[port]] [param*]

定义后端主机的各服务器及其选项，用于listen和backend中。

server <name> <address>[:port] [settings ...]

default-server [settings ...]

<name> ：服务器在haproxy 上的内部名称；出现在日志及警告信息

<address> ：服务器地址，支持使用主机名

[:[port]] ：端口映射；省略时，表示同bind 中绑定的端口

[param*] ：参数

weight <weight> ：权重，默认为1

maxconn <maxconn> ：当前后端server 的最大并发连接数

backlog <backlog> ：当server 的连接数达到上限后的后援队列长度

backup ：设定当前server 为备用服务器Sorry Server

Haproxy的配置选项众多，不能详尽，读者可查看其官方文档进行学习。

https://cbonte.github.io/haproxy-dconv/

本文出自 “Keep simple keep stupid” 博客，请务必保留此出处http://yangzhiheng.blog.51cto.com/11586378/1979161

以上是关于初识千万级高并发负载均衡软件HaProxy的主要内容，如果未能解决你的问题，请参考以下文章

美团面试题：如何设计负载均衡架构支撑千万级用户的高并发访问？

千万级负载神器 LVSNginx及HAProxy工作原理大图详解！

千万级流量架构下的负载均衡解析

美团面试题：如何设计负载均衡架构支撑千万级用户的高并发访问？

千万级流量架构下的负载均衡解析