LVS-DR实验
百度百科:
可伸缩网络服务的几种结构,它们都需要一个前端的负载调度器(或者多个进行主从备份)。我们先分析实现虚拟网络服务的主要技术,指出IP负载均衡技术是在负载调度器的实现技术中效率最高的。在已有的IP负载均衡技术中,主要有通过网络地址转换(Network Address Translation)将一组服务器构成一个高性能的、高可用的虚拟服务器,我们称之为VS/NAT技术(Virtual Server via Network Address Translation)。在分析VS/NAT的缺点和网络服务的非对称性的基础上,我们提出了通过IP隧道实现虚拟服务器的方法VS/TUN (Virtual Server via IP Tunneling),和通过直接路由实现虚拟服务器的方法VS/DR(Virtual Server via Direct Routing),它们可以极大地提高系统的伸缩性。VS/NAT、VS/TUN和VS/DR技术是LVS集群中实现的三种IP负载均衡技术。
实验拓扑图
隐藏VIP方法:
对外隐藏,对内部可见
kernel parameter:
-
目标mac地址为全F,交换机触发广播
-
/peoc/sys/net/ipv4/conf/*IF*/
-
arp_ignore:定义接收到的ARP请求时的响应级别,
- 0:只要本地配置的有相应的地址,给予相应
- 1:仅在请求的目标(MAC)地址配置请求到达的接口上的时候,给予响应,
-
arp_announce:定义将自己的地址向外通告的时候通告级别
- 0:将本地任何接口上的任何地址向外通过,
- 1:试图仅向目标网络通告其网络匹配的地址
- 2:仅向与本地接口上地址匹配的网络进行通告
[root@MDNode01 ~]# cd /proc/sys/net/ipv4/conf/
[root@MDNode01 conf]# pwd
/proc/sys/net/ipv4/conf
[root@MDNode01 conf]# ll
total 0
dr-xr-xr-x 0 root root 0 Oct 18 17:15 all
dr-xr-xr-x 0 root root 0 Oct 18 17:05 default
dr-xr-xr-x 0 root root 0 Oct 18 17:15 eth0
dr-xr-xr-x 0 root root 0 Oct 18 17:15 lo
[root@MDNode01 conf]# cd all/
[root@MDNode01 all]# ll
total 0
-rw-r--r-- 1 root root 0 Oct 18 17:16 accept_local
-rw-r--r-- 1 root root 0 Oct 18 17:16 accept_redirects
-rw-r--r-- 1 root root 0 Oct 18 17:16 accept_source_route
-rw-r--r-- 1 root root 0 Oct 18 17:16 arp_accept
-rw-r--r-- 1 root root 0 Oct 18 17:16 arp_announce
-rw-r--r-- 1 root root 0 Oct 18 17:16 arp_filter
-rw-r--r-- 1 root root 0 Oct 18 17:16 arp_ignore
-rw-r--r-- 1 root root 0 Oct 18 17:16 arp_notify
-rw-r--r-- 1 root root 0 Oct 18 17:16 bootp_relay
-rw-r--r-- 1 root root 0 Oct 18 17:16 disable_policy
-rw-r--r-- 1 root root 0 Oct 18 17:16 disable_xfrm
-rw-r--r-- 1 root root 0 Oct 18 17:16 force_igmp_version
-rw-r--r-- 1 root root 0 Oct 18 17:16 forwarding
-rw-r--r-- 1 root root 0 Oct 18 17:16 log_martians
-r--r--r-- 1 root root 0 Oct 18 17:16 mc_forwarding
-rw-r--r-- 1 root root 0 Oct 18 17:16 medium_id
-rw-r--r-- 1 root root 0 Oct 18 17:16 promote_secondaries
-rw-r--r-- 1 root root 0 Oct 18 17:16 proxy_arp
-rw-r--r-- 1 root root 0 Oct 18 17:16 proxy_arp_pvlan
-rw-r--r-- 1 root root 0 Oct 18 17:16 route_localnet
-rw-r--r-- 1 root root 0 Oct 18 17:16 rp_filter
-rw-r--r-- 1 root root 0 Oct 18 17:16 secure_redirects
-rw-r--r-- 1 root root 0 Oct 18 17:16 send_redirects
-rw-r--r-- 1 root root 0 Oct 18 17:16 shared_media
-rw-r--r-- 1 root root 0 Oct 18 17:16 src_valid_mark
-rw-r--r-- 1 root root 0 Oct 18 17:16 tag
[root@MDNode01 all]# cat arp_ignore
0
[root@MDNode01 all]# cat arp_announce
0
[root@MDNode01 all]#
all、default、eth0和lo下面的arp_ignoce和arp_announce的配置都是0;
将arp_ignore配置为1,将隐藏的ip配置在环回网卡上,可以在一块网卡配置多个ip地址,
LVS 由2部分程序组成,包括 ipvs 和 ipvsadm。
1.ipvs(ip virtual server):一段代码工作在内核空间,叫ipvs,是真正生效实现调度的代码。
2.ipvsadm:另外一段是工作在用户空间,叫ipvsadm,负责为ipvs内核框架编写规则,定义谁是集群服务,而谁是后端真实的服务器(Real Server)
类型:
- NAT:地址转换
- DR:直接路由
- TUN:隧道
基于DR的LVS负载均衡
在LVS(TUN)模式下,由于需要在LVS调度器与真实服务器之间创建隧道连接,这同样会增加服务器的负担。与LVS(TUN)类似,DR模式也叫直接路由模式,其体系结构如图4所示,该模式中LVS依然仅承担数据的入站请求以及根据算法选出合理的真实服务器,最终由后端真实服务器负责将响应数据包发送返回给客户端。与隧道模式不同的是,直接路由模式(DR模式)要求调度器与后端服务器必须在同一个局域网内,VIP地址需要在调度器与后端所有的服务器间共享,因为最终的真实服务器给客户端回应数据包时需要设置源IP为VIP地址,目标IP为客户端IP,这样客户端访问的是调度器的VIP地址,回应的源地址也依然是该VIP地址(真实服务器上的VIP),客户端是感觉不到后端服务器存在的。由于多台计算机都设置了同样一个VIP地址,所以在直接路由模式中要求调度器的VIP地址是对外可见的,客户端需要将请求数据包发送到调度器主机,而所有的真实服务器的VIP地址必须配置在Non-ARP的网络设备上,也就是该网络设备并不会向外广播自己的MAC及对应的IP地址,真实服务器的VIP对外界是不可见的,但真实服务器却可以接受目标地址VIP的网络请求,并在回应数据包时将源地址设置为该VIP地址。调度器根据算法在选出真实服务器后,在不修改数据报文的情况下,将数据帧的MAC地址修改为选出的真实服务器的MAC地址,通过交换机将该数据帧发给真实服务器。整个过程中,真实服务器的VIP不需要对外界可见。
LVS负载均衡(LVS简介、三种工作模式、十种调度算法)
LVS负载均衡调度算法
根据前面的介绍,我们了解了LVS的三种工作模式,但不管实际环境中采用的是哪种模式,调度算法进行调度的策略与算法都是LVS的核心技术,LVS在内核中主要实现了一下十种调度算法
四种静态调度:
- rr:轮播
- wrr:加权连
- dh
- sh
动态调度方法:
- lc:最少连接
- wls:加权最少连接
- sed:最短期望延迟
- nq:never queue
- LBLC:基于本地连接最少
- DH:
- LBLCCR:基于本地的带复制功能的最少连接
1.轮询调度
轮询调度(Round Robin 简称\'RR\')算法就是按依次循环的方式将请求调度到不同的服务器上,该算法最大的特点就是实现简单。轮询算法假设所有的服务器处理请求的能力都一样的,调度器会将所有的请求平均分配给每个真实服务器。
2.加权轮询调度
加权轮询(Weight Round Robin 简称\'WRR\')算法主要是对轮询算法的一种优化与补充,LVS会考虑每台服务器的性能,并给每台服务器添加一个权值,如果服务器A的权值为1,服务器B的权值为2,则调度器调度到服务器B的请求会是服务器A的两倍。权值越高的服务器,处理的请求越多。
3.最小连接调度
最小连接调度(Least Connections 简称\'LC\')算法是把新的连接请求分配到当前连接数最小的服务器。最小连接调度是一种动态的调度算法,它通过服务器当前活跃的连接数来估计服务器的情况。调度器需要记录各个服务器已建立连接的数目,当一个请求被调度到某台服务器,其连接数加1;当连接中断或者超时,其连接数减1。
(集群系统的真实服务器具有相近的系统性能,采用最小连接调度算法可以比较好地均衡负载。)
4.加权最小连接调度
加权最少连接(Weight Least Connections 简称\'WLC\')算法是最小连接调度的超集,各个服务器相应的权值表示其处理性能。服务器的缺省权值为1,系统管理员可以动态地设置服务器的权值。加权最小连接调度在调度新连接时尽可能使服务器的已建立连接数和其权值成比例。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
5.基于局部的最少连接
基于局部的最少连接调度(Locality-Based Least Connections 简称\'LBLC\')算法是针对请求报文的目标IP地址的 负载均衡调度,目前主要用于Cache集群系统,因为在Cache集群客户请求报文的目标IP地址是变化的。这里假设任何后端服务器都可以处理任一请求,算法的设计目标是在服务器的负载基本平衡情况下,将相同目标IP地址的请求调度到同一台服务器,来提高各台服务器的访问局部性和Cache命中率,从而提升整个集群系统的处理能力。LBLC调度算法先根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则使用\'最少连接\'的原则选出一个可用的服务器,将请求发送到服务器。
6.带复制的基于局部性的最少连接
带复制的基于局部性的最少连接(Locality-Based Least Connections with Replication 简称\'LBLCR\')算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统,它与LBLC算法不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。按\'最小连接\'原则从该服务器组中选出一一台服务器,若服务器没有超载,将请求发送到该服务器;若服务器超载,则按\'最小连接\'原则从整个集群中选出一台服务器,将该服务器加入到这个服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。
7.目标地址散列调度
目标地址散列调度(Destination Hashing 简称\'DH\')算法先根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且并未超载,将请求发送到该服务器,否则返回空。
8.源地址散列调度U
源地址散列调度(Source Hashing 简称\'SH\')算法先根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且并未超载,将请求发送到该服务器,否则返回空。它采用的散列函数与目标地址散列调度算法的相同,它的算法流程与目标地址散列调度算法的基本相似。
9.最短的期望的延迟
最短的期望的延迟调度(Shortest Expected Delay 简称\'SED\')算法基于WLC算法。举个例子吧,ABC三台服务器的权重分别为1、2、3 。那么如果使用WLC算法的话一个新请求进入时它可能会分给ABC中的任意一个。使用SED算法后会进行一个运算
A:(1+1)/1=2 B:(1+2)/2=3/2 C:(1+3)/3=4/3 就把请求交给得出运算结果最小的服务器。
10.最少队列调度
最少队列调度(Never Queue 简称\'NQ\')算法,无需队列。如果有realserver的连接数等于0就直接分配过去,不需要在进行SED运算。
【参考】
https://zhuanlan.zhihu.com/p/56716855
https://zhuanlan.zhihu.com/p/85129512