老司机带你在分布式架构玩负载均衡

Posted 瀚林府

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了老司机带你在分布式架构玩负载均衡相关的知识,希望对你有一定的参考价值。

当前大多数的互联网系统都使用了服务器集群技术,集群即将相同服务部署在多台服务器上构成一个集群整体对外提供服务,这些集群可以是Web应用服务器集群,也可以是数据库服务器集群,还可以是分布式缓存服务器集群等。


在实际应用中,在Web服务器集群之前总会有一台负载均衡服务器,负载均衡设备的任务就是作为Web服务器流量的入口,挑选最合适的一台Web服务器,将客户端的请求转发给它处理,实现客户端到真实服务端的透明转发。


软件负载解决的两个核心问题是:选谁、转发,其中最著名的是LVS(Linux Virtual Server)。

一个典型的互联网应用的拓扑结构是这样的:

老司机带你在分布式架构玩负载均衡

那么,这种计算机技术的实现方式有多种。最常用的是四层和七层负载均衡:


四层负载均衡

七层负载均衡

七层负载均衡工作在OSI模型的应用层,应用层协议较多,常用http、radius、DNS等。七层负载就可以基于这些协议来负载。这些应用层协议中会包含很多有意义的内容。比如同一个Web服务器的负载均衡,除了根据IP加端口进行负载外,还可根据七层的URL、浏览器类别、语言来决定是否要进行负载均衡。

老司机带你在分布式架构玩负载均衡

对于一般的应用来说,有了nginx就够了。Nginx可以用于七层负载均衡。但是对于一些大的网站,一般会采用DNS+四层负载+七层负载的方式进行多层次负载均衡。

老司机带你在分布式架构玩负载均衡

常用负载均衡工具,Nginx/LVS/HAProxy是目前使用最广泛的三种负载均衡软件。


LVS主要用来做四层负载均衡。

LVS架构

LVS架设的服务器集群系统由三个部分组成:最前端的负载均衡层(Loader Balancer),中间的服务器群组层,用Server Array表示,最底层的数据共享存储层,用Shared Storage表示。在用户看来所有的应用都是透明的,用户只是在使用一个虚拟服务器提供的高性能服务。

老司机带你在分布式架构玩负载均衡

Nginx

Nginx是一个网页服务器,它能反向代理HTTP、HTTPS,、SMTP、POP3、IMAP的协议链接,以及一个负载均衡器和一个HTTP缓存。

Nginx主要用来做七层负载均衡。

并发性能:官方支持每秒5万并发,实际国内一般到每秒2万并发,有优化到每秒10万并发的。具体性能看应用场景。

特点:

  • 模块化设计:良好的扩展性,可以通过模块方式进行功能扩展。

  • 高可靠性:主控进程和worker是同步实现的,一个worker出现问题,会立刻启动另一个worker。

  • 内存消耗低:一万个长连接(keep-alive),仅消耗2.5MB内存。

  • 支持热部署:不用停止服务器,实现更新配置文件,更换日志文件、更新服务器程序版本。

  • 并发能力强:官方数据每秒支持5万并发;

  • 功能丰富:优秀的反向代理功能和灵活的负载均衡策略

Nginx的基本工作模式

老司机带你在分布式架构玩负载均衡

一个master进程,生成一个或者多个worker进程。但这里master是使用root身份启动的,因为nginx要工作在80端口。而只有管理员才有权限启动小于低于1023的端口。master主要是负责的作用只是启动worker,加载配置文件,负责系统的平滑升级。其它的工作是交给worker。那当worker被启动之后,也只是负责一些web最简单的工作,而其它的工作都是由worker中调用的模块来实现的。

模块之间是以流水线的方式实现功能的。流水线,指的是一个用户请求,由多个模块组合各自的功能依次实现完成的。比如:第一个模块只负责分析请求首部,第二个模块只负责查找数据,第三个模块只负责压缩数据,依次完成各自工作。来实现整个工作的完成。

它们是如何实现热部署的呢?是这样的,我们前面说master不负责具体的工作,而是调用worker工作,它只是负责读取配置文件,因此当一个模块修改或者配置文件发生变化,是由master进行读取,因此此时不会影响到worker工作。在master进行读取配置文件之后,不会立即把修改的配置文件告知worker。而是让被修改的worker继续使用老的配置文件工作,当worker工作完毕之后,直接当掉这个子进程,更换新的子进程,使用新的规则。

HAProxy

HAProxy也是使用较多的一款负载均衡软件。HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,是免费、快速并且可靠的一种解决方案。特别适用于那些负载特大的web站点。运行模式使得它可以很简单安全的整合到当前的架构中,同时可以保护你的web服务器不被暴露到网络上。

HAProxy是一个使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。

Haproxy主要用来做七层负载均衡。

常见负载均衡算法

上面介绍负载均衡技术的时候提到过,负载均衡服务器在决定将请求转发到具体哪台真实服务器时,是通过负载均衡算法来实现的。负载均衡算法可以分为两类:静态负载均衡算法和动态负载均衡算法。

  • 静态负载均衡算法包括:轮询、比率、优先权。

  • 动态负载均衡算法包括:最少连接数、最快响应速度、观察方法、预测法、动态性能分配、动态服务器补充、服务质量、服务类型、规则模式。

轮询(Round Robin):顺序循环将请求一次顺序循环地连接每个服务器。当其中某个服务器发生第二到第7 层的故障,BIG-IP 就把其从顺序循环队列中拿出,不参加下一次的轮询,直到其恢复正常。

以轮询的方式依次请求调度不同的服务器; 实现时,一般为服务器带上权重;这样有两个好处:

  • 针对服务器的性能差异可分配不同的负载;

  • 当需要将某个结点剔除时,只需要将其权重设置为0即可;

优点:实现简单、高效;易水平扩展

缺点:请求到目的结点的不确定,造成其无法适用于有写的场景(缓存,数据库写)

应用场景:数据库或应用服务层中只有读的场景

随机方式:请求随机分布到各个结点;在数据足够大的场景能达到一个均衡分布;

优点:实现简单、易水平扩展

缺点:同Round Robin,无法用于有写的场景

应用场景:数据库负载均衡,也是只有读的场景

哈希方式:根据key来计算需要落在的结点上,可以保证一个同一个键一定落在相同的服务器上;

优点:相同key一定落在同一个结点上,这样就可用于有写有读的缓存场景

缺点:在某个结点故障后,会导致哈希键重新分布,造成命中率大幅度下降

解决:一致性哈希 or 使用keepalived保证任何一个结点的高可用性,故障后会有其它结点顶上来

应用场景:缓存,有读有写

一致性哈希:在服务器一个结点出现故障时,受影响的只有这个结点上的key,最大程度的保证命中率; 如twemproxy中的ketama方案; 生产实现中还可以规划指定子key哈希,从而保证局部相似特征的键能分布在同一个服务器上;

优点:结点故障后命中率下降有限

应用场景:缓存

根据键的范围来负载:根据键的范围来负载,前1亿个键都存放到第一个服务器,1~2亿在第二个结点。

优点:水平扩展容易,存储不够用时,加服务器存放后续新增数据

缺点:负载不均;数据库的分布不均衡;

(数据有冷热区分,一般最近注册的用户更加活跃,这样造成后续的服务器非常繁忙,而前期的结点空闲很多)

适用场景:数据库分片负载均衡

根据键对服务器结点数取模来负载:根据键对服务器结点数取模来负载;比如有4台服务器,key取模为0的落在第一个结点,1落在第二个结点上。

优点:数据冷热分布均衡,数据库结点负载均衡分布;

缺点:水平扩展较难;

适用场景:数据库分片负载均衡

纯动态结点负载均衡:根据CPU、IO、网络的处理能力来决策接下来的请求如何调度。

优点:充分利用服务器的资源,保证个结点上负载处理均衡

缺点:实现起来复杂,真实使用较少

不用主动负载均衡:使用消息队列转为异步模型,将负载均衡的问题消灭;负载均衡是一种推模型,一直向你发数据,那么将所有的用户请求发到消息队列中,所有的下游结点谁空闲,谁上来取数据处理;转为拉模型之后,消除了对下行结点负载的问题。

优点:通过消息队列的缓冲,保护后端系统,请求剧增时不会冲垮后端服务器;水平扩展容易,加入新结点后,直接取queue即可;

缺点:不具有实时性;

应用场景:不需要实时返回的场景;

比如,12036下订单后,立刻返回提示信息:您的订单进去排队了...等处理完毕后,再异步通知;

比率(Ratio):给每个服务器分配一个加权值为比例,根椐这个比例,把用户的请求分配到每个服务器。当其中某个服务器发生第2到第7 层的故障,BIG-IP 就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。

优先权(Priority):给所有服务器分组,给每个组定义优先权,BIG-IP 用户的请求,分配给优先级最高的服务器组(在同一组内,采用轮询或比率算法,分配用户的请求);当最高优先级中所有服务器出现故障,BIG-IP 才将请求送给次优先级的服务器组。这种方式,实际为用户提供一种热备份的方式。

最少的连接方式(Least Connection):传递新的连接给那些进行最少连接处理的服务器。当其中某个服务器发生第2到第7 层的故障,BIG-IP 就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。

最快模式(Fastest):传递连接给那些响应最快的服务器。当其中某个服务器发生第二到第7 层的故障,BIG-IP 就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。

观察模式(Observed):连接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。当其中某个服务器发生第二到第7 层的故障,BIG-IP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。

预测模式(Predictive):BIG-IP利用收集到的服务器当前的性能指标,进行预测分析,选择一台服务器在下一个时间片内,其性能将达到最佳的服务器相应用户的请求。(被BIG-IP 进行检测)

动态性能分配(Dynamic Ratio-APM):BIG-IP 收集到的应用程序和应用服务器的各项性能参数,动态调整流量分配。

动态服务器补充(Dynamic Server Act.):当主服务器群中因故障导致数量减少时,动态地将备份服务器补充至主服务器群。

服务质量(QoS):按不同的优先级对数据流进行分配。

服务类型(ToS): 按不同的服务类型(在Type of Field中标识)负载均衡对数据流进行分配。

规则模式:针对不同的数据流设置导向规则,用户可自行。

负载均衡的几种算法Java实现代码

  • 轮询

老司机带你在分布式架构玩负载均衡

老司机带你在分布式架构玩负载均衡

老司机带你在分布式架构玩负载均衡

  • 加权随机负载均衡算法

老司机带你在分布式架构玩负载均衡

老司机带你在分布式架构玩负载均衡

  • 随机负载均衡算法

老司机带你在分布式架构玩负载均衡

老司机带你在分布式架构玩负载均衡

  • 负载均衡 ip_hash算法.


以上是关于老司机带你在分布式架构玩负载均衡的主要内容,如果未能解决你的问题,请参考以下文章

负载均衡在分布式架构中是怎么玩起来的?(附赠书)

负载均衡 (Load balancing) 在分布式架构中是怎么玩起来的?

老司机带你探知存储伸缩之道,赶紧上车,来不及了!

50份架构文档荟萃(分布式事务-缓存-消息-搜索电商支付,多活...)

60份架构文档荟萃(分布式事务-缓存-消息-搜索电商支付,多活...)

一篇读懂分布式架构下的负载均衡