超详细!一文带你了解 LVS 负载均衡集群!

Posted 杰哥的IT之旅

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了超详细!一文带你了解 LVS 负载均衡集群!相关的知识,希望对你有一定的参考价值。

前言

超详细!一文带你了解 LVS 负载均衡集群!

文章目录

一、什么是 LVS?
二、为什么要用 LVS?
三、LVS 的组成及作用
四、负载均衡的由来及所带来的好处
五、LVS 负载均衡集群的类型
六、DNS / 软硬件负载均衡的类型
七、LVS 集群的通用体系结构
八、LVS 负载均衡的基本原理
九、LVS 负载均衡的三种工作模式
十、LVS 的十种负载调度算法
十一、LVS 涉及相关的术语与说明
参考文献
总结

一、什么是 LVS?

使用 LVS 可以达到的技术目标是:通过 LVS 达到的负载均衡技术和 Linux 操作系统实现一个高性能高可用的 Linux 服务器集群,具有良好的可靠性、可扩展性和可操作性。从而以低廉的成本实现最优的性能。LVS 是一个实现负载均衡集群的开源软件项目,LVS 架构从逻辑上可分为调度层、Server 集群层和共享存储层。

二、为什么要用 LVS?

在之前的 nginx 系列中,介绍了 Nginx 负载均衡服务,详细可参考:《》那为什么还需要用 LVS 呢?

随着 Internet 的爆炸性增长以及日常生活中的日益重要的作用,Internet 上的流量速度增长,以每年 100% 以上的速度增长。服务器上的工作负载压力也迅速增加,因此服务器在短时间内将会过载,尤其是对于受欢迎的网站而言。为了克服服务器的过载压力问题,有两种解决方案。

  • 一种是:单服务器解决方案,即将服务器升级到性能更高的服务器,但是当请求增加时,将很快过载,因此必须再次对其进行升级,升级过程复杂且成本高;

  • 另一个是:多服务器解决方案,即在服务器集群上构建可扩展的网络服务系统。当负载增加时,可以简单地在群集中添加新服务器或更多服务器以满足不断增长的需求,而商用服务器具有最高的性能/成本比。因此,构建用于网络服务的服务器群集系统更具可伸缩性,并且更具成本效益。

构建服务器集群的方法:

  • 基于 DNS 的负载均衡集群

但是,由于客户端和分层 DNS 系统的缓存特性,很容易导致服务器之间的动态负载不平衡,因此服务器很难处理其峰值负载。在 DNS 服务器上不能很好地选择名称映射的 TTL 值。

  • 基于分派器的负载平衡集群

负载均衡可以分为两个级别,即应用程序级别和IP级别。例如,反向代理 和pWEB是用于构建可伸缩Web服务器的应用程序级负载平衡方法。他们将HTTP请求转发到群集中的其他Web服务器,获取结果,然后将其返回给客户端。由于在应用程序级别处理HTTP请求和答复的开销很高,我相信当服务器节点数增加到5个或更多时,应用程序级别的负载均衡器将成为新的瓶颈,这取决于每个服务器的吞吐量服务器。

LVS 与 Nginx 功能对比
  • LVS 比 Nginx 具有更强的抗负载能力,性能高,对内存和 CPU 资源消耗较低;

  • LVS 工作在网络层,具体流量由操作系统内核进行处理,Nginx 工作在应用层,可针对 HTTP 应用实施一些分流策略;

  • LVS 安装配置较复杂,网络依赖性大,稳定性高。Nginx 安装配置较简单,网络依赖性小;

  • LVS 不支持正则匹配处理,无法实现动静分离效果。Nginx 可实现这方面的功能,具体可参考:《》、《》;

三、LVS 的组成及作用

LVS 由两部分程序组成,包括 ipvs 和 ipvsadm。

1、 ipvs(ip virtual server):LVS 是基于内核态的 netfilter 框架实现的 IPVS 功能,工作在内核态。用户配置 VIP 等相关信息并传递到 IPVS 就需要用到 ipvsadm 工具。

2、 ipvsadm:ipvsadm 是 LVS 用户态的配套工具,可以实现 VIP 和 RS 的增删改查功能,是基于 netlink 或 raw socket 方式与内核 LVS 进行通信的,如果 LVS 类比于 netfilter,那 ipvsadm 就是类似 iptables 工具的地位。

作用:
  • 主要用于多服务器的负载均衡;

  • 工作在网络层,可实现高性能,高可用的服务器集群技术;

  • 廉价,可把许多低性能的服务器组合在一起形成一个超级服务器;

  • 易用,配置简单,有多种负载均衡的方法;

  • 稳定可靠,即使在集群的服务器中某台服务器无法正常工作,也不影响整体效果;

  • 可扩展性好;

四、负载均衡的由来及所带来的好处

在业务刚起步时,一般先使用单台服务器对外进行提供服务。随着后期的业务增长,流量也越来越大。当这单台服务器的访问量越大时,服务器所承受的压力也就越大,性能也将无法满足业务需求,超出自身所指定的访问压力就会崩掉,避免发生此类事情的发生。

我们将采取其他方案,将多台服务器组成集群系统从而来提高整体服务器的处理性能,使用统一入口(流量调度器)的方式通过均衡的算法进行对外提供服务,将用户大量的请求均衡地分发到后端集群不同的服务器上。因此也就有了负载均衡来分担服务器的压力。

使用负载均衡给我们所带来的好处:提高系统的整体性能、提高系统的扩展性、提高系统的高可用性;

五、LVS 负载均衡集群的类型

负载均衡群集:Load Balance Cluster,以提高应用系统的响应能力,尽可能处理更多的访问请求、减少延迟为目标,从而获得高并发、高负载的整体性能。

高可用群集:High Availability Cluster,以提高应用系统的可靠性,尽可能的减少终端时间为目标、确保服务的连续性,达到高可用的容错效果。

高性能运算群集:High Performance Computer Cluster,以提高应用系统的 CPU 运算速度、扩展硬件资源和分析能力为目标、从而获得相当于大型、超级计算机的高性能计算能力。

六、DNS / 软硬件负载均衡的类型

1)DNS 实现负载均衡

一个域名通过 DNS 解析到多个 IP,每个 IP 对应不同的服务器实例,就完成了流量的调度,这也是 DNS 实现负载均衡是最简单的方式。

使用该方式最大的优点:实现简单,成本低,无需自己开发或维护负载均衡设备,不过存在一些缺点:服务器故障切换延迟大,升级不方便、流量调度不均衡,粒度大、流量分配策略较简单,支持的算法较少、DNS 所支持的 IP 列表有限制要求。

2)硬件负载均衡

硬件负载均衡是通过专门的硬件设备从而来实现负载均衡功能,比如:交换机、路由器就是一个负载均衡专用的网络设备。

目前典型的硬件负载均衡设备有两款:F5 和 A10。不过话说,能用上这种硬件负载均衡设备的企业都不是一般的公司,反而普通业务量级小的其他企业基本用不到。

硬件负载均衡的优点:

  • 功能强大:支持各层级负载均衡及全面负载均衡算法;

  • 性能强大:性能远超常见的软件负载均衡器;

  • 稳定性高:硬件负载均衡,大规模使用肯定是严格测试过的;

  • 安全防护:除具备负载均衡功能外,还具备防火墙、防 DDoS 攻击等安全功能;

硬件负载均衡的缺点:

  • 价格昂贵;

  • 可扩展性差;

  • 调试维护麻烦;

3)软件负载均衡

  • Nginx :支持 4 层 / 7 层负载均衡,支持 HTTP、E-mail 协议;

  • LVS :纯 4 层负载均衡,运行在内核态,性能是软件负载均衡中最高的;

  • HAproxy :是 7 层负载均衡软件,支持 7 层规则的设置,性能也不错;

软件负载均衡的优点:

  • 简单、灵活、便宜(直接在 Linux 操作系统上安装上述所使用的软件负载均衡,部署及维护较简单,4 层 和 7 层负载均衡可根据业务进行选择也可根据业务特点,比较方便进行扩展及定制功能);

七、LVS 集群的通用体系结构

超详细!一文带你了解 LVS 负载均衡集群!

负载均衡器:是服务器群集系统的单个入口点,可运行 IPVS,该 IPVS 在 Linux 内核或 KTCPVS 内部实现 IP 负载均衡技术,在 Linux 内核中实现应用程序级负载平衡。使用 IPVS 时,要求所有服务器提供相同的服务和内容,负载均衡器根据指定的调度算法和每个服务器的负载将新的客户端请求转发到服务器。无论选择哪个服务器,客户端都应获得相同的结果。使用 KTCPVS 时,服务器可以具有不同的内容,负载均衡器可以根据请求的内容将请求转发到其他服务器。由于 KTCPVS 是在 Linux 内核内部实现的,因此中继数据的开销很小,因此仍可以具有较高的吞吐量。

服务器群集的节点可根据系统所承受的负载进行分担。当所有服务器过载时,可添加多台服务器来处理不断增加的工作负载。对于大多数 Internet 服务(例如Web),请求通常没有高度关联,并且可以在不同服务器上并行运行。因此,随着服务器群集的节点数增加,整体性能几乎可以线性扩展。

第三层:共享存储:Shared Storage,为服务器池中的所有节点提供稳定、一致的文件存储服务,确保整个群集的统一性,可使用 NAS 设备或提供 NFS (Network File System)网络文件系统共享服务的专用服务器。

共享存储:可以是数据库系统,网络文件系统或分布式文件系统。服务器节点需要动态更新的数据应存储在基于数据的系统中,当服务器节点并行在数据库系统中读写数据时,数据库系统可以保证并发数据访问的一致性。静态数据通常保存在网络文件系统(例如 NFS 和 CIFS)中,以便可以由所有服务器节点共享数据。但是,单个网络文件系统的可伸缩性受到限制,例如,单个 NFS / CIFS 只能支持 4 到 8 个服务器的数据访问。对于大型集群系统,分布式/集群文件系统可以用于共享存储,例如 GPFS,Coda 和 GFS,然后共享存储也可以根据系统需求进行扩展。

八、LVS 负载均衡的基本原理

netfilter 的基本原理

在介绍 LVS 负载均衡基本原理之前,先说一下 netfilter 的基本原理。因为 LVS 是基于 Linux 内核中 netfilter 框架实现的负载均衡系统,netfilter 其实很复杂也很重要,平时说的 Linux 防火墙就是 netfilter,不过我们操作的还是 iptables,iptables 和 netfilter 是 Linux 防火墙组合工具,是一起来完成系统防护工作的。

iptables 是位于用户空间,而 Netfilter 是位于内核空间。iptables 只是用户空间编写和传递规则的工具而已,真正工作的还是 netfilter。

两者间的区别:

  • prerouting: 在对数据包做路由选择之前,将应用此链中的规则;

  • output: 当防火墙本机向外发送数据包时,将应用此链中的规则;

  • postrouting: 在对数据包做路由选择之后,将应用此链中的规则;

iptable 是用户层的工具,提供命令行接口,能够向 Netfilter 中添加规则策略,从而实现报文过滤,修改等功能。关于 iPtables 相关文章可参考如下:

通过下图我们可以来了解下 netfilter 的工作机制:

超详细!一文带你了解 LVS 负载均衡集群!

当数据包通过网络接口进入时,经过链路层之后进入网络层到达 PREROUTING,然后根据目标 IP 地址进行查找路由。

如目标 IP 是本机,数据包会传到INPUT上,经过协议栈后根据端口将数据送到相应的应用程序;应用程序将请求处理后把响应数据包发送至OUTPUT里,最终通过POSTROUTING后发送出网络接口。

如目标 IP 不是本机,并且服务器开启了FORWARD参数,这时会将数据包递送给 FORWARD,最后通过POSTROUTING后发送出网络接口。

LVS 的基本原理

超详细!一文带你了解 LVS 负载均衡集群!

LVS 基于 netfilter 框架,工作在 INPUT 链上,在 INPUT 链上注册 ip_vs_in HOOK 函数,进行 IPVS 相关主流程,详细原理概述如下:

1、 当客户端用户访问 www.baidu.com 网站时,用户访问请求通过层层网络,最终通过交换机进入 LVS 服务器网卡进入内核空间层。

3、 因为 IPVS 工作在 INPUT 链上,会根据访问的VIP端口判断请求是否为 IPVS 服务,是的情况下,则调用注册的IPVS HOOK 函数,进行IPVS相关流程,并强制修改数据包的相关数据,并将数据包发往POSTROUTING链中。

上面就是我们所介绍的 LVS 的工作原理,那么 LVS 负载均衡还包括三种工作模式,且每种模式工作原理都有所不同,适用于不同应用场景,其最终目的都是能实现均衡的流量调度和良好的扩展性。

九、LVS 负载均衡的三种工作模式

超详细!一文带你了解 LVS 负载均衡集群!

NAT 实现原理过程

1、 客户端发出的请求数据包经过网络到达 LVS 网卡,数据包源 IP 为 CIP,目的 IP 为 VIP。

4、 被修改过的数据包经过 POSTROUTING 链后,到达 RS 服务器,数据包源 IP 为 CIP,目的 IP 为 RIP。

5、 RS 服务器经过处理后,将会把数据包发送至用户空间的应用程序,待处理完成后,发送响应数据包,RS 服务器的默认网关为 LVS 的 IP,应用程序将会把数据包转发至下一跳 LVS 服务器,数据包源 IP 为 RIP,目的 IP 为 CIP。

6、 LVS 服务器收到 RS 服务器响应的数据包后,查找路由,目的 IP 不是本机 IP并且 LVS 服务器开启了 FORWARD 模式,会将数据包转发给它,数据包不变。

7、 LVS 服务器收到响应数据包后,根据目的 IP 和 目的 PORT  查找相应的服务,这时,源 IP 为 VIP,通过查找路由,确定下一跳信息并将数据包发送至网关,最终回应给客户端用户。

NAT 模式的优缺点:

优点:

  • 支持 Windows 操作系统;

缺点:

  • RS 服务器需配置网关;

  • 双向流量对 LVS 会产生较大的负载压力;

NAT 模式的使用场景:

  • 对 windows 操作系统的用户比较友好,使用 LVS ,必须选择 NAT 模式。

超详细!一文带你了解 LVS 负载均衡集群!

TUN 实现原理过程

1、 客户端发送数据包经过网络后到 LVS 网卡,数据包源 IP 为 CIP,目的 IP 为 VIP。

2、 进入 PREROUTING 链后,会根据目的 IP 去查找路由,确定是否为本机 IP,数据包将转发至 INPUT 链中,到 LVS,源 IP 和 目的 IP 不变。

3、 到 LVS 后,通过目的 IP 和目的 PORT 查找是否为 IPVS 服务,如是 IPVS 服务,将会选择一个 RS 后端服务器, 源 IP 为 DIP,目标 IP 为 RIP,数据包将会转发至 OUTPUT 链中。

4、 数据包根据路由信息到达 LVS 网卡,发送至路由器网关,最终到达后端服务器。

TUN 模式的优缺点:

优点:

  • 单臂模式,LVS 负载压力小;

  • 数据包修改小,信息完整性高;

  • 可跨机房;

缺点:

  • 不支持端口映射;

  • 需在 RS 后端服务器安装模块及配置 VIP;

  • 隧道头部的加入可能会导致分片,最终会影响服务器性能;

TUN 模式的使用场景:

  • 如对转发性要求较高且具有跨机房需求的,可选择 TUN 模式。

直接路由:Direct Routing,简称 DR 模式,采用半开放式的网络结构,与 TUN 模式的结构类似,但各节点并不是分散在各个地方,而是与调度器位于同一个物理网络,负载调度器与各节点服务器通过本地网络连接,不需要建立专用的 IP 隧道。它是最常用的工作模式,因为它的功能性强大。

超详细!一文带你了解 LVS 负载均衡集群!

DR 实现原理过程

3、 数据包到达 INPUT 链中,LVS 会根据目的 IP 和 Port(端口)确认是否为 LVS 定义的服务,如是定义过的 VIP 服务,会根据配置的服务信息,从 RealServer 中选择一个后端服务器 RS1,然后 RS1 作为目标出方向的路由,确定下一跳信息及数据包通过具体的哪个网卡发出,最好将数据包通过 INET_HOOK 到 OUTPUT 链中。

DS 模式的优缺点:

优点:

  • 响应数据不经过 LVS,性能高;

  • 对数据包修改小,信息完整性好;

缺点:

  • LVS 与 RS 必须在同一个物理网络;

  • RS 上必须配置 lo 和其他内核参数;

  • 不支持端口映射;

DS 模式的使用场景:

十、LVS 的十种负载调度算法

轮询:Round Robin,将收到的访问请求按顺序轮流分配给群集中的各节点真实服务器中,不管服务器实际的连接数和系统负载。

加权轮询:Weighted Round Robin,根据真实服务器的处理能力轮流分配收到的访问请求,调度器可自动查询各节点的负载情况,并动态跳转其权重,保证处理能力强的服务器承担更多的访问量。

最少连接:Least Connections,根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数少的节点,如所有服务器节点性能都均衡,可采用这种方式更好的均衡负载。

加权最少连接:Weighted Least Connections,服务器节点的性能差异较大的情况下,可以为真实服务器自动调整权重,权重较高的节点将承担更大的活动连接负载。

复杂的基于局部性的最少连接:LBLCR,具有复杂调度算法的基于位置的最少连接也用于目标IP负载平衡,通常在高速缓存群集中使用。与 LBLC 调度有以下不同:负载平衡器维护从目标到可以为目标提供服务的一组服务器节点的映射。对目标的请求将分配给目标服务器集中的最少连接节点。如果服务器集中的所有节点都超载,则它将拾取群集中的最少连接节点,并将其添加到目标服务器群中。如果在指定时间内未修改服务器集群,则从服务器集群中删除负载最大的节点,以避免高度负载。

最短延迟调度:SED,最短的预期延迟调度算法将网络连接分配给具有最短的预期延迟的服务器。如果将请求发送到第 i 个服务器,则预期的延迟时间为(Ci +1)/ Ui,其中 Ci 是第 i 个服务器上的连接数,而 Ui 是第 i 个服务器的固定服务速率(权重) 。

永不排队调度:NQ,从不队列调度算法采用两速模型。当有空闲服务器可用时,请求会发送到空闲服务器,而不是等待快速响应的服务器。如果没有可用的空闲服务器,则请求将被发送到服务器,以使其预期延迟最小化(最短预期延迟调度算法)。

十一、LVS 涉及相关的术语及说明

上述内容中涉及到很多术语或缩写,这里简单解释下具体的含义,便于理解。

  • DS: Director Server,前端负载均衡节点服务器。

  • RS: Real Server,后端真实服务器。

Reference

http://www.linuxvirtualserver.org/
http://www.linuxvirtualserver.org/how.html
http://www.linuxvirtualserver.org/Documents.html

总结

回顾下,通过本文你可学习到什么是 LVS、为什么要用 LVS、LVS 的组成及作用、负载均衡的由来及所带来的好处、LVS 负载均衡集群的类型(负载均衡集群、高可用集群、高性能运算集群)、DNS 实现负载均衡 / 硬件和软件的负载均衡 、LVS 负载均衡的通用体系结构(负载调度器、服务器池、共享存储)、LVS 负载均衡的基本原理及基于netfilter 的基本原理和工作机制、LVS 负载均衡的三种工作模式(NAT、TUN、DR)LVS 十种负载均衡调度算法(RR、WRR、LC、WLC、LBLC、LBLCR、DH、SH、SED、NQ)以及相关涉及到的 LVS 术语及说明等;

如果你觉得这篇文章对你有点用的话,就请为本文留个言,点个在看,或者转发一下吧,因为这将是我持续输出更多优质文章的最强动力!感谢大家!


超详细!一文带你了解 LVS 负载均衡集群!杰哥的IT之旅推荐搜索