互联网研发中负载均衡算法一点探索

Posted 互联网开发者Club

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了互联网研发中负载均衡算法一点探索相关的知识,希望对你有一定的参考价值。

当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放        负载均衡在线上服务中有着很重要作用,因为一台web服务比如tomcat,能够处理qps(每秒处理请求数)是有限的。那么就需要有有前端负载均衡服务将大的流量分发为多个后端服务进行处理。

       负载均衡产品有硬件F5、有软件,早之前使用Apache较多,目前是使用nginx多,Nginx架构实现简洁优雅性能高。LVS、HAProxy是著名软负载工具。说到LVS是由原淘宝章文蒿(目前在滴滴公司)博士领导开发,是到目前为止Linux内核中网络核心部分,也是国人开Linux内核最高贡献,章博士在国内技术圈封神,实至名归。当然国内对于Linux内核进行贡献代码人很多,以后有机会可以介绍下那些牛人。

       硬件F5优点是负载均衡效果好、效率高,缺点是配置复杂,成本高。

       Apache、Nginx可以进行软件负载,软件负载性能没有硬件负载性能高,但优势是配置灵活并且能知道后端负载情况,根据后端负载调整负载均衡配置。Nginx支持多种负载均衡算法,根据实际情况调整负载配置来满足业务需要。软件负载成本低效果也能满足线上性能需要,软件负载在互联网企业有着广泛用途。

       web网站软件负载均衡过程是,用户请求打到负载均衡Apache、Nginx上,由Apache、Nginx转发到多个Tomcat服务,Tomcat上web服务接收到请求处理完返回给Apache或Nginx,Apache和Nginx将请求返回给前端浏览器,完成整个负载均衡过程。

       nginx负载均衡算法:有轮训负载均衡算法,ip hash负载均衡算法,url hash负载均衡算法,轮训加权负载均衡算法,fair 负载算法按服务端相应时间来分配请求。

       dubbo微服务本身也是通过软件负载来分配客户端请求,与web差异点是一:负载是在客户端进行处理而不是服务端。二是负载是负载请求次数而不是连接,因为当下微服务都是通过netty来实现长连接,负载是负载多个长连接对于每个连接中产生调用次数。

       1、轮训算法:前端请求按时间顺序按顺序配置到后端服务器,如果是后台服务当掉,如果后台服务器当掉,则去掉有问题机器,对于用户请求无感知,用户不会知道已有服务掉线,也是实现服务高可用。

       2、加权负载均衡算法:指定轮训权重,权重越大,给后端服务转发请求越多,这种配置用在后台服务器性能有好好差情况下,后台性能好机器配置高权重,后台性能差服务配置低权重,根据实际后台服务情况调整权重配置。

       3、ip hash可以根据用户请求ip按照hash算法将请求分配到固定后端服务上,这样可以解决用户在动态服务上session共享问题,当前session共享也可以通过共同存储,比如将session存储到数据库或者将session存储到redis来解决session共享问题。

        ip hash还有个好处就是在618、双11等电商大促高并发场景下,当用户请求超过系统能够处理负载,实现对用户排队,通过排队避免用户请求过多压垮系统。

       4、url hash:按访问url hash将固定url访问,打到固定节点服务,这样可以根据url调整服务资源,最大化资源利用率。

       5、fair负载均衡算法:根据服务端相应时间,来调整分配给每一台后端服务请求数量,这样可以更智能、合理、资源最大化使用实现负载调配。

       负载均衡算法还要注意失效节点负载重新进行均匀分配,而不是对整个流量全部进行重新分配。避免突然给后台服务增加很多请求造成服务不可用。再有就是负载均衡算法成熟,要避免bug导致服务击穿,并且产生洪泛效应,将所有服务节点均打垮最终导致服务不可用。

        对于每一个技术都要掌握原理,很好的去使用它,发挥它最大优势,勿在浮沙筑高台,希望对大家有帮助。

以上是关于互联网研发中负载均衡算法一点探索的主要内容,如果未能解决你的问题,请参考以下文章

那些NB哄哄的负载均衡算法到底是什么样子的?

DPVS - 小米高性能负载均衡器

技术分享|负载均衡原理及其算法实现

负载均衡阅读总结

如何实现高性能负载均衡设计?

负载均衡在分布式架构中是怎么玩起来的?(附赠书)