亿级流量场景下,大型缓存架构设计实现---- 实现高可用

Posted gxyandwmm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了亿级流量场景下,大型缓存架构设计实现---- 实现高可用相关的知识,希望对你有一定的参考价值。

1、Hystrix是什么?

在分布式系统中,每个服务都可能会调用很多其他服务,被调用的那些服务就是依赖服务,有的时候某些依赖服务出现故障也是很正常的。

Hystrix可以让我们在分布式系统中对服务间的调用进行控制,加入一些调用延迟或者依赖故障的容错机制。

Hystrix通过将依赖服务进行资源隔离,进而组织某个依赖服务出现故障的时候,这种故障在整个系统所有的依赖服务调用中进行蔓延,同时Hystrix还提供故障时的fallback降级机制

总而言之,Hystrix通过这些方法帮助我们提升分布式系统的可用性和稳定性。

初步看一看Hystrix的设计原则是什么?

 

hystrix为了实现高可用性的架构,设计hystrix的时候,一些设计原则是什么?

(1)对依赖服务调用时出现的调用延迟和调用失败进行控制和容错保护

(2)在复杂的分布式系统中,阻止某一个依赖服务的故障在整个系统中蔓延,服务A->服务B->服务C,服务C故障了,服务B也故障了,服务A故障了,整套分布式系统全部故障,整体宕机

(3)提供fail-fast(快速失败)和快速恢复的支持

(4)提供fallback优雅降级的支持

(5)支持近实时的监控、报警以及运维操作

 

调用延迟+失败,提供容错

阻止故障蔓延

快速失败+快速恢复

降级

监控+报警+运维

 

2、再看Hystrix的更加细节的设计原则是什么?

 

(1)阻止任何一个依赖服务耗尽所有的资源,比如tomcat中的所有线程资源

(2)避免请求排队和积压,采用限流和fail fast来控制故障

(3)提供fallback降级机制来应对故障

(4)使用资源隔离技术,比如bulkhead(舱壁隔离技术),swimlane(泳道技术),circuit breaker(短路技术),来限制任何一个依赖服务的故障的影响

(5)通过近实时的统计/监控/报警功能,来提高故障发现的速度

(6)通过近实时的属性和配置热修改功能,来提高故障处理和恢复的速度

(7)保护依赖服务调用的所有故障情况,而不仅仅只是网络故障情况

 

调用这个依赖服务的时候,client调用包有bug,阻塞,等等,依赖服务的各种各样的调用的故障,都可以处理.。

技术图片

 

 

 

3、Hystrix是如何实现它的目标的?

(1)通过HystrixCommand或者HystrixObservableCommand来封装对外部依赖的访问请求,这个访问请求一般会运行在独立的线程中,资源隔离。

(2)对于超出我们设定阈值的服务调用,直接进行超时,不允许其耗费过长时间阻塞住。这个超时时间默认是99.5%的访问时间,但是一般我们可以自己设置一下

(3)为每一个依赖服务维护一个独立的线程池,或者是semaphore,当线程池已满时,直接拒绝对这个服务的调用

(4)对依赖服务的调用的成功次数,失败次数,拒绝次数,超时次数,进行统计

(5)如果对一个依赖服务的调用失败次数超过了一定的阈值,自动进行熔断,在一定时间内对该服务的调用直接降级,一段时间后再自动尝试恢复

(6)当一个服务调用出现失败,被拒绝,超时,短路等异常情况时,自动调用fallback降级机制

(7)对属性和配置的修改提供近实时的支持

 

画图分析,对依赖进行资源隔离后,如何避免依赖服务调用延迟或失败导致当前服务的故障

 

技术图片

 

以上是关于亿级流量场景下,大型缓存架构设计实现---- 实现高可用的主要内容,如果未能解决你的问题,请参考以下文章

亿级流量电商详情页系统的大型高并发与高可用缓存架构实战

亿级流量电商系统实战视频缓存架构+高可用服务架构+微服务架构

百亿级流量大型分布式系统平台架构设计实战

百亿级流量大型分布式系统平台架构设计实战

百亿级流量大型分布式系统平台架构设计实战

百亿级流量大型分布式系统平台架构设计实战