Spring Cloud Hystrix理解与实践:搭建简单监控集群
Posted jian0110
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spring Cloud Hystrix理解与实践:搭建简单监控集群相关的知识,希望对你有一定的参考价值。
前言
在分布式架构中,所谓的断路器模式是指当某个服务发生故障之后,通过断路器的故障监控,向调用方返回一个错误响应,这样就不会使得线程因调用故障服务被长时间占用不释放,避免故障的继续蔓延。Spring Cloud Hystrix实现了断路器,线程隔离等一系列服务保护功能,它是基于Netflix的开源框架Hystrix实现的。
目的不是介绍Hystrix的与原理、及其使用等(有时间也要记录啊),而是通过实战搭建一个简单的监控集群,使用Hystrix Dashboard仪表盘动态监控展示以此来加深对Hystrix的认识与理解,为什么要记录呢?这是因为网上资料甚少(或版本过低,不适用),同时加之书中的Spring Cloud版本与现在Spring Boot 2.x差距明显
本文主要参考《Spring Cloud 微服务实战》(PDF电子版,需要的朋友可以私聊或评论)
一、Hystrix 仪表盘
1、认识Hystrix仪表盘
HystrixCommand与HystrixObserableCommand实例执行过程中记录的重要信息称之为Hystrix仪表盘,以供内部或者外部进行查询使用。Spring Cloud整合仪表盘组件Hystrix Dashboard,主要用来实时监控Hystrix的各项指标信息,可以帮我们快速发现系统中存在的问题,从而及时地采取应对措施。
1)加入依赖
特别注意Spring Boot 2.x版本引入的hystrix-dashboard依赖,不然可能访问不了http://localhost:port/hystrix仪表盘页面,注解@EnableHsytrixDashboard也可能找不到
<!-- hystrix 容错机制 --> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-hystrix</artifactId> <version>${spring-cloud-eureka.version}</version> </dependency> <!-- actuator监控 --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency> <!-- Spring Boot 2.x以上版本 spring-cloud-starter-netflix-hystrix-dashboard 仪表盘, 以下版本则需要spring-cloud-starter-hystrix-dashboard--> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId> <version>${spring-cloud-eureka.version}</version> </dependency>
2)添加配置
# 应用实例
spring:
application:
name: hystrix-dashboard
server:
port: 8000
# actuator开放所有端点,Spring Boot 2.x与1.x不同,具体请查询
management:
endpoints:
web:
exposure:
include: "*"
3)增加注解:应用主类加上@EnableHsytrixDashboard,启用Hystrix Dashboard功能。
@EnableHystrixDashboard // 开启Hystrix仪表盘 @SpringBootApplication public class HystrixMonitorApplication { public static void main(String[] args) { SpringApplication.run(HystrixMonitorApplication.class, args); } }
4)访问http://localhost:8000/hystrix界面如下:
2、监控页面介绍
从界面中我们就可以看到Hystrix Dashboard支持不同的三种监控方式:
1) 默认的集群监控:通过URL http://turbine-hostname:port/turbine.stream
2) 指定的集群监控:通过URL http://turbine-hostname:port/turbine.stream?cluster=[clusterName]开启
3) 单体应用的监控:URL http://hystrix-app:port/hystrix.stream开启,实现对具体某个服务实例的监控
前两者关于集群的监控需要整合turbine才能实现,而对于单体实例节点需要访问实例的/hystrix.stream接口实现,我们自然需要为服务实例添加端点。只需要添加acutator与hystrix依赖,应用主程序类开启断路器@EnableCircuitBreaker注解与@EnableHystrixDashboard注解即可。
其中的参数:
1)Delay:用来控制服务器上轮询监控信息的延迟时间,默认为2000ms。可以通过该配置该属性降低客户端的网络和CPU消耗。
2)Ttile:对应进入监控后的的标题,如Hystrix,则进入监控页面后如下图红框标题
此外,我们在URL框输入我们需要监听的某个服务实例/hystrix.stream接口,如http://localhost:8081/hystrix.stream,就可以进入监控页面
监控页面参数介绍:
1) 实心圆与曲线的含义
实心圆颜色:健康度从绿色、黄色、橙色、红色递减
实心圆大小:会根绝实例的请求流量发生变化,流量越大实心圆就越大。
曲线:用来记录2分钟内流量的相对变化,可以通过它来观察流量的上升与下降。
2) 其它的指标参数:鼠标停留会显示相应的说明
二、简单监控架构
1、监控单实例的架构
1)架构图
2)过程说明
-
- 服务提供者:HELLO-SERVICE,提供一个接口如:http:/HELLO-SERVER/hello,让消费者通过restTemplate(封装好的HTTP)调用消费
- 服务消费者:RIBBON-CONSUMER,会有ribbon承担负载均衡的作用,分别轮询访问HELLO-SERVER-1与HELLO-SERVICE-2
- 注册中心:Spring Cloud Eureka,主要负责服务治理:服务的注册、续约、剔除(更新)等
- Hystrix仪盘表:通过/hystrix.stream接口监控某个服务实例,动态展示仪表盘数据。
然而现在只针对一个实例来监控,而分布式系统中往往有很多实例,我们就需要利用Turbine和Hystrix Dashboard配置实现对集群的监控
2、监控聚合服务
需要通过Turbine来聚合RIBBON-CONSUMER-1与服务RIBBON-CONSUMER-2成一个服务展示监控信息,并输出到Hystrix Dashboard中,只显示一张监控图,但是注意Hosts的数量为2
(1)架构图
(2)过程说明
同上述“单实例监控”,不同的是这次服务消费者有RIBBON-CONSUMER-1与RIBBON-CONSUMER-2两个,通过/turbine.stream接口聚合两个服务实例(实则就是同一个服务不同实例)成一个服务,共同动态展示整个集群的动态数据。对于集群来说关注的是服务集群的高可用性,所以Turbine会将相同服务作为整体看待。
=======================整理过后,补充代码实例=====================
以上是关于Spring Cloud Hystrix理解与实践:搭建简单监控集群的主要内容,如果未能解决你的问题,请参考以下文章
断路器Hystrix与Turbine集群监控-Spring Cloud学习第三天
笔记:Spring Cloud Feign Hystrix 配置