HAProxy详解

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HAProxy详解相关的知识,希望对你有一定的参考价值。

一.高性能负载均衡软件HAProxy介绍:

        随着互联网业务的迅猛发展,大型电商平台和门户网站对系统的可用性和可靠性要求越来越高,高可用集群、负载均衡集群成为一种热门的系统架构解决方案。在众多的负载均衡集群解决方案中,有基于硬件的负载均衡设备,例如F5、Big-IP等,也有基于软件的负载均衡产品,例如HAProxy、LVS、nginx等。在软件的负载均衡产品中,又分为两种实现方式,分别是基于操作系统的软负载实现和基于第三方应用的软负载实现。LVS就是基于Linux操作系统实现的一种软负载均衡,而HAProxy就是基于第三应用实现的软负载均衡。

    1.HAProxy简介:

            HAProxy是一个开源的、高性能的、基于TCP(第四层)和HTTP(第七层)应用的负载均衡软件,借助HAProxy可以快速、可靠的提供基于TCP和HTTP应用的负载均衡解决方案。HAProxy作为一个专业的负载均衡软件,它的显著优点如下:

                ■可靠性和稳定性非常好,可以与硬件级的F5负载均衡设备相媲美。

                □最高可以同时维护40000~50000个并发连接,单位时间内处理的最大请求数为20000个,最大数据处理能力可达10Gbps。作为软件级别的负载均衡来说,HAProxy的性能强大可见一斑。

                ■支持多于8种的负载均衡算法,同时也支持session保持。

                □支持虚拟主机功能,这样实现web负载均衡更加灵活。

                ■从HAProxy1.3版本后开始支持连接拒绝、全透明代理等功能,这些功能是其他负载均衡器所不具备的。

                □HAProxy拥有功能强大的ACL支持,能给使用带来很大方便。

            HAProxy是借助于操作系统的技术特性来实现性能最大化的,因此,在使用HAProxy时,对操作系统进行性能调优是非常重要的。在业务系统方面,HAProxy非常适用于那些并发量特别大且需要持久连接或四层和七层处理机制的web系统,例如门户网站或电商网站等。另外,HAProxy也可用于mysql数据库(读操作)的负载均衡。

    2.四层和七层负载均衡的区别:

            所谓的四层就是ISO参考模型中的第四层。四层负载均衡器也称为四层交换机,它主要是通过分析IP层及TCP/UDP层的流量实现的基于“IP+端口”的负载均衡。常见的基于四层的负载均衡器有LVS、F5等。

            以常见的TCP应用为例,负载均衡器在接收到第一个来自客户端的SYN请求时,会通过设定的负载均衡算法选择一台最佳的后端服务器,同时将报文中目标IP地址修改为后端服务器IP,然后直接转发给后端服务器,这样一个负载均衡请求就完成了。从这个过程来看,一个TCP连接是客户端和服务器直接建立的,而负载均衡器只不过完成了一个类似路由器的转发动作。在某些负载均衡策略中,为保证后端服务器返回的报文可以正确传递给负载均衡器,在转发报文的同时可能还会对报文原来的源地址进行修改。过程如图:

                技术分享图片

技术分享图片            同理,七层负载均衡器也称为七层交换机,位于ISO的最高层,即应用层,此时负载均衡器支持多种应用协议,常见的有HTTP、FTP、SMTP等。七层负载均衡器可以根据报文内容,再配合负载均衡算法来选择后端服务器,因此也称为“内容交换器”。比如,对于web服务器的负载均衡,七层负载均衡器不但可以根据“IP+端口”的方式进行负载分流,还可以根据网站的URL、访问域名、浏览器类别、语言等决定负载均衡的策略。例如,有两台web服务器分别对应中英文两个网站,两个域名分别是A、B,要实现访问A域名时进入中文网站,访问B域名时进入英文网站,这在四层负载均衡器中几乎是无法实现的,而七层负载均衡器可以根据客户端访问域名的不同选择对应的网页进行负载均衡处理。常见的七层负载均衡器有HAProxy、Nginx等。

            这里仍以常见的TCP应用为例,由于负载均衡器要获取到报文的内容,因此只能先代替后端服务器和客户端建立连接,接着,才能收到客户端发送过来的报文内容,然后在根据该报文中特定字段加上负载均衡器中设置的负载均衡器算法来决定最终选择的内部服务器。纵观整个过程,七层负载均衡器在这种情况下类似于一个代理服务器。如图:

                        技术分享图片

技术分享图片            对比四层负载均衡器和七层负载均衡器运行的整个过程,可以看出,在七层负载均衡模式下,负载均衡器与客户端及后端的服务器会分别建立一次TCP连接,而在四层负载均衡模式下,仅建立一次TCP连接。由此可知,七层负载均衡对负载均衡设备的要求更高,而七层负载均衡的处理能力也必然低于四层模式的负载均衡。

    3.HAProxy与LVS的异同:                

            1)两者都是软件负载均衡产品,但是LVS是基于linux操作系统实现的一种软负载均衡,而HAProxy是基于第三应用实现的软负载均衡。

            2)LVS是基于四层的IP负载均衡技术,而HAProxy是基于四层和七层技术、可提供TCP和HTTP应用的负载均衡综合解决方案。

            3)LVS工作在ISO模型的第四层,因此其状态监测功能单一,而HAProxy在状态监测方面功能强大,可支持端口、URL、脚本等多种状态检测方式。

            4)虽然HAProxy功能强大,但是它的整体处理性低于四层负载均衡模式的LVS,而LVS拥有接近硬件设备的网络吞吐和连接负载能力。


技术分享图片


技术分享图片


                

以上是关于HAProxy详解的主要内容,如果未能解决你的问题,请参考以下文章

高可用高性能负载均衡软件HAproxy详解指南-第三章:HAproxy实例

HAProxy详解

haproxy详解

HAProxy详解:HAProxy基础配置与应用实例

HAProxy详解:HAProxy介绍

Haproxy 配置详解