Hystrix semaphore和thread隔离策略的区别及配置参考

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hystrix semaphore和thread隔离策略的区别及配置参考相关的知识,希望对你有一定的参考价值。

参考技术A Hystrix所有的配置都是 hystrix.command.[HystrixCommandKey] 开头,其中 [HystrixCommandKey] 是可变的,默认是 default ,即 hystrix.command.default ;另外Hystrix内置了默认参数,如果没有配置Hystrix属性,默认参数就会被设置,其优先级:

hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds 用来设置thread和semaphore两种隔离策略的超时时间,默认值是1000。

这个超时时间要根据 CommandKey 所对应的业务和服务器所能承受的负载来设置,要根据 CommandKey 业务的平均响应时间设置,一般是大于平均响应时间的 20%~100% ,最好是根据压力测试结果来评估,这个值设置太大,会导致线程不够用而会导致太多的任务被fallback;设置太小,一些特殊的慢业务失败率提升,甚至会造成这个业务一直无法成功,在重试机制存在的情况下,反而会加重后端服务压力。

这个值并非 TPS 、 QPS 、 RPS 等都是相对值,指的是1秒时间窗口内的事务/查询/请求, semaphore.maxConcurrentRequests 是一个绝对值,无时间窗口,相当于亚毫秒级的,指任意时间点允许的并发数。当请求达到或超过该设置值后,其其余就会被拒绝。默认值是100。

是否开启超时,默认是true,开启。

发生超时是是否中断线程,默认是true。

取消时是否中断线程,默认是false。

实用技巧:Hystrix传播ThreadLocal对象(两种方案)

目前,Spring Cloud已在南京公司推广开来,不仅如此,深圳那边近期也要基于Spring Cloud新开微服务了。

于是,领导要求我出一套基于Spring Cloud的快速开发脚手架(近期开源)。在编写脚手架的过程中,也顺带总结一下以前在项目中遇到的问题:

使用Hystrix时,如何传播ThreadLocal对象?

我们知道,Hystrix有隔离策略:THREAD以及SEMAPHORE。

如果你不知道Hystrix的隔离策略,可以阅读我的书籍《Spring Cloud与Docker微服务架构实战》,或者参考文档:https://github.com/Netflix/Hystrix/wiki/Configuration#executionisolationstrategy

引子

当隔离策略为 THREAD 时,是没办法拿到 ThreadLocal 中的值的。

举个例子,使用Feign调用某个远程API,这个远程API需要传递一个Header,这个Header是动态的,跟你的HttpRequest相关,我们选择编写一个拦截器来实现Header的传递(当然也可以在Feign Client接口的方法上加 RequestHeader )。

示例代码:

 
   
   
 
  1. public class KeycloakRequestInterceptor implements RequestInterceptor {

  2.    private static final String AUTHORIZATION_HEADER = "Authorization";

  3.    @Override

  4.    public void apply(RequestTemplate template) {

  5.        ServletRequestAttributes attributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes();

  6.        Principal principal = attributes.getRequest().getUserPrincipal();

  7.        if (principal != null && principal instanceof KeycloakPrincipal) {

  8.            KeycloakSecurityContext keycloakSecurityContext = ((KeycloakPrincipal) principal)

  9.                    .getKeycloakSecurityContext();

  10.            if (keycloakSecurityContext instanceof RefreshableKeycloakSecurityContext) {

  11.                RefreshableKeycloakSecurityContext.class.cast(keycloakSecurityContext)

  12.                        .refreshExpiredToken(true);

  13.                template.header(AUTHORIZATION_HEADER, "Bearer " + keycloakSecurityContext.getTokenString());

  14.            }

  15.        }

  16.        // 否则啥都不干

  17.    }

  18. }

你可能不知道Keycloak是什么,不过没有关系,相信这段代码并不难阅读,该拦截器做了几件事:

  • 使用 RequestContextHolder.getRequestAttributes() 静态方法获得Request。

  • 从Request获得当前用户的身份,然后使用Keycloak的API拿到Token,并扔到Header里。

  • 这样,Feign使用这个拦截器时,就会用你这个Header去请求了。

注:Keycloak是一个非常容易上手,并且功能强大的单点认证平台。

现实很骨感

以上代码可完美运行——但仅限于Feign不开启Hystrix支持时。

注:Spring Cloud Dalston以及更高版可使用 feign.hystrix.enabled=true 为Feign开启Hystrix支持。

当Feign开启Hystrix支持时,

 
   
   
 
  1. ServletRequestAttributes attributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes();

是 null 。

原因在于,Hystrix的默认隔离策略是 THREAD 。而 RequestContextHolder 源码中,使用了两个血淋淋的 ThreadLocal 。

解决方案一:调整隔离策略

将隔离策略设为SEMAPHORE即可:

 
   
   
 
  1. hystrix.command.default.execution.isolation.strategy: SEMAPHORE

这样配置后,Feign可以正常工作。

但该方案不是特别好。原因是Hystrix官方强烈建议使用THREAD作为隔离策略! 参考文档:

Thread or Semaphore

The default, and the recommended setting, is to run HystrixCommands using thread isolation ( THREAD) and HystrixObservableCommands using semaphore isolation ( SEMAPHORE).

Commands executed in threads have an extra layer of protection against latencies beyond what network timeouts can offer.

Generally the only time you should use semaphore isolation for HystrixCommands is when the call is so high volume (hundreds per second, per instance) that the overhead of separate threads is too high; this typically only applies to non-network calls.

于是,那么有没有更好的方案呢?

解决方案二:自定义并发策略

既然Hystrix不太建议使用SEMAPHORE作为隔离策略,那么是否有其他方案呢?答案是自定义并发策略,目前,Spring Cloud Sleuth以及Spring Security都通过该方式传递 ThreadLocal 对象。

下面我们来编写自定义的并发策略。

编写自定义并发策略

编写自定义并发策略比较简单,只需编写一个类,让其继承 HystrixConcurrencyStrategy ,并重写 wrapCallable 方法即可。

代码示例:

 
   
   
 
  1. @Component

  2. public class RequestAttributeHystrixConcurrencyStrategy extends HystrixConcurrencyStrategy {

  3.    private static final Log log = LogFactory.getLog(RequestHystrixConcurrencyStrategy.class);

  4.    public RequestHystrixConcurrencyStrategy() {

  5.        HystrixPlugins.reset();

  6.        HystrixPlugins.getInstance().registerConcurrencyStrategy(this);

  7.    }

  8.    @Override

  9.    public <T> Callable<T> wrapCallable(Callable<T> callable) {

  10.        RequestAttributes requestAttributes = RequestContextHolder.getRequestAttributes();

  11.        return new WrappedCallable<>(callable, requestAttributes);

  12.    }

  13.    static class WrappedCallable<T> implements Callable<T> {

  14.        private final Callable<T> target;

  15.        private final RequestAttributes requestAttributes;

  16.        public WrappedCallable(Callable<T> target, RequestAttributes requestAttributes) {

  17.            this.target = target;

  18.            this.requestAttributes = requestAttributes;

  19.        }

  20.        @Override

  21.        public T call() throws Exception {

  22.            try {

  23.                RequestContextHolder.setRequestAttributes(requestAttributes);

  24.                return target.call();

  25.            } finally {

  26.                RequestContextHolder.resetRequestAttributes();

  27.            }

  28.        }

  29.    }

  30. }

如代码所示,我们编写了一个 RequestHystrixConcurrencyStrategy ,在其中:

  • wrapCallable 方法拿到 RequestContextHolder.getRequestAttributes() ,也就是我们想传播的对象;

  • 在 WrappedCallable 类中,我们将要传播的对象作为成员变量,并在其中的call方法中,为静态方法设值。

  • 这样,在Hystrix包裹的方法中,就可以使用 RequestContextHolder.getRequestAttributes() 获取到相关属性——也就是说,可以拿到 RequestContextHolder 中的 ThreadLocal 属性。

经过测试,代码能正常工作。

新的问题

至此,我们已经实现了 ThreadLocal 属性的传递,然而Hystrix只允许有一个并发策略!这意味着——如果不做任何处理,Sleuth、Spring Security将无法正常拿到上下文!(上文说过,目前Sleuth、Spring Security都是通过自定义并发策略的方式来传递ThreadLocal对象的。)

如何解决这个问题呢?

我们知道,Spring Cloud中,Spring Cloud Security与Spring Cloud Sleuth是可以共存的!我们不妨参考下Sleuth以及Spring Security的实现:

  • Sleuth: org.springframework.cloud.sleuth.instrument.hystrix.SleuthHystrixConcurrencyStrategy

  • Spring Security: org.springframework.cloud.netflix.hystrix.security.SecurityContextConcurrencyStrategy

阅读完后,你将恍然大悟——于是,我们可以模仿它们的写法,改写上文编写的并发策略:

 
   
   
 
  1. public class RequestAttributeHystrixConcurrencyStrategy extends HystrixConcurrencyStrategy {

  2.    private static final Log log = LogFactory.getLog(RequestAttributeHystrixConcurrencyStrategy.class);

  3.    private HystrixConcurrencyStrategy delegate;

  4.    public RequestAttributeHystrixConcurrencyStrategy() {

  5.        try {

  6.            this.delegate = HystrixPlugins.getInstance().getConcurrencyStrategy();

  7.            if (this.delegate instanceof RequestAttributeHystrixConcurrencyStrategy) {

  8.                // Welcome to singleton hell...

  9.                return;

  10.            }

  11.            HystrixCommandExecutionHook commandExecutionHook = HystrixPlugins

  12.                    .getInstance().getCommandExecutionHook();

  13.            HystrixEventNotifier eventNotifier = HystrixPlugins.getInstance()

  14.                    .getEventNotifier();

  15.            HystrixMetricsPublisher metricsPublisher = HystrixPlugins.getInstance()

  16.                    .getMetricsPublisher();

  17.            HystrixPropertiesStrategy propertiesStrategy = HystrixPlugins.getInstance()

  18.                    .getPropertiesStrategy();

  19.            this.logCurrentStateOfHystrixPlugins(eventNotifier, metricsPublisher,

  20.                    propertiesStrategy);

  21.            HystrixPlugins.reset();

  22.            HystrixPlugins.getInstance().registerConcurrencyStrategy(this);

  23.            HystrixPlugins.getInstance()

  24.                    .registerCommandExecutionHook(commandExecutionHook);

  25.            HystrixPlugins.getInstance().registerEventNotifier(eventNotifier);

  26.            HystrixPlugins.getInstance().registerMetricsPublisher(metricsPublisher);

  27.            HystrixPlugins.getInstance().registerPropertiesStrategy(propertiesStrategy);

  28.        }

  29.        catch (Exception e) {

  30.            log.error("Failed to register Sleuth Hystrix Concurrency Strategy", e);

  31.        }

  32.    }

  33.    private void logCurrentStateOfHystrixPlugins(HystrixEventNotifier eventNotifier,

  34.            HystrixMetricsPublisher metricsPublisher,

  35.            HystrixPropertiesStrategy propertiesStrategy) {

  36.        if (log.isDebugEnabled()) {

  37.            log.debug("Current Hystrix plugins configuration is ["

  38.                    + "concurrencyStrategy [" + this.delegate + "]," + "eventNotifier ["

  39.                    + eventNotifier + "]," + "metricPublisher [" + metricsPublisher + "],"

  40.                    + "propertiesStrategy [" + propertiesStrategy + "]," + "]");

  41.            log.debug("Registering Sleuth Hystrix Concurrency Strategy.");

  42.        }

  43.    }

  44.    @Override

  45.    public <T> Callable<T> wrapCallable(Callable<T> callable) {

  46.        RequestAttributes requestAttributes = RequestContextHolder.getRequestAttributes();

  47.        return new WrappedCallable<>(callable, requestAttributes);

  48.    }

  49.    @Override

  50.    public ThreadPoolExecutor getThreadPool(HystrixThreadPoolKey threadPoolKey,

  51.            HystrixProperty<Integer> corePoolSize,

  52.            HystrixProperty<Integer> maximumPoolSize,

  53.            HystrixProperty<Integer> keepAliveTime, TimeUnit unit,

  54.            BlockingQueue<Runnable> workQueue) {

  55.        return this.delegate.getThreadPool(threadPoolKey, corePoolSize, maximumPoolSize,

  56.                keepAliveTime, unit, workQueue);

  57.    }

  58.    @Override

  59.    public ThreadPoolExecutor getThreadPool(HystrixThreadPoolKey threadPoolKey,

  60.            HystrixThreadPoolProperties threadPoolProperties) {

  61.        return this.delegate.getThreadPool(threadPoolKey, threadPoolProperties);

  62.    }

  63.    @Override

  64.    public BlockingQueue<Runnable> getBlockingQueue(int maxQueueSize) {

  65.        return this.delegate.getBlockingQueue(maxQueueSize);

  66.    }

  67.    @Override

  68.    public <T> HystrixRequestVariable<T> getRequestVariable(

  69.            HystrixRequestVariableLifecycle<T> rv) {

  70.        return this.delegate.getRequestVariable(rv);

  71.    }

  72.    static class WrappedCallable<T> implements Callable<T> {

  73.        private final Callable<T> target;

  74.        private final RequestAttributes requestAttributes;

  75.        public WrappedCallable(Callable<T> target, RequestAttributes requestAttributes) {

  76.            this.target = target;

  77.            this.requestAttributes = requestAttributes;

  78.        }

  79.        @Override

  80.        public T call() throws Exception {

  81.            try {

  82.                RequestContextHolder.setRequestAttributes(requestAttributes);

  83.                return target.call();

  84.            }

  85.            finally {

  86.                RequestContextHolder.resetRequestAttributes();

  87.            }

  88.        }

  89.    }

  90. }

简单讲解下:

  • 将现有的并发策略作为新并发策略的成员变量

  • 在新并发策略中,返回现有并发策略的线程池、Queue。

Pull Request

笔者已将该实现方式Pull Request:https://github.com/spring-cloud/spring-cloud-netflix/pull/2509 ,希望官方能够接纳,也希望在不久的将来,能够更舒服、更爽地使用Spring Cloud。

PS. Pull Request的代码跟博客中的代码略有区别,有少量简单的优化,主要是增加了一个开关。

灵感来自

  • https://stackoverflow.com/questions/34062900/forward-a-request-header-with-a-feign-client-requestinterceptor

  • https://stackoverflow.com/questions/34719809/unreachable-security-context-using-feign-requestinterceptor

  • https://github.com/spring-cloud/spring-cloud-netflix/pull/1379

  • https://github.com/Writtscher/kanoon


以上是关于Hystrix semaphore和thread隔离策略的区别及配置参考的主要内容,如果未能解决你的问题,请参考以下文章

Zuul 默认 hystrix 隔离策略为 SEMAPHORE

hystrix中RequestContextHolder取值为空的问题

hystrix中RequestContextHolder取值为空的问题

实用技巧:Hystrix传播ThreadLocal对象(两种方案)

hystrix参数说明

python - threading-semaphore 示例