SpringCloud升级之路2020.0.x版-19.Eureka的服务端设计与配置
Posted zhxdick
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SpringCloud升级之路2020.0.x版-19.Eureka的服务端设计与配置相关的知识,希望对你有一定的参考价值。
Eureka Server 配置是 Eureka Server 需要的一些配置,包括之前多次提到的定时检查实例过期的配置,自我保护相关的配置,同一 zone 内集群相关的配置和跨 zone 相关的配置。在 Spring Cloud 中,Eureka 客户端配置以 eureka.server
开头,对应配置类为 EurekaServerConfigBean
根据上一节 Eureka 客户端分析,我们知道 Eureka 客户端主要访问如下几个接口:
- 注册:
POST /eureka/apps/appID
- 心跳:
PUT /eureka/apps/appID/instanceID
- 获取所有服务实例:
GET /eureka/apps
- 增量获取所有服务实例:
GET /eureka/apps/delta
Eureka Server 处理这些请求的核心逻辑,以及相关配置如下图所示:
实例注册后需要发送心跳证明这个实例是活着的,Eureka Server 中也有定时任务检查实例是否已经过期。
eureka:
server:
#主动检查服务实例是否失效的任务执行间隔,默认是 60s
eviction-interval-timer-in-ms: 3000
#这个配置在两个地方被使用:
#如果启用用了自我保护,则会 renewal-threshold-update-interval-ms 指定的时间内,收到的心跳请求个数是否小于实例个数乘以这个 renewal-percent-threshold
#定时任务检查过期实例,每次最多过期 1 - renewal-percent-threshold 这么多比例的实例
renewal-percent-threshold: 0.85
服务器中有定时过期的任务,检查迟迟没有心跳的实例,并注销他们。自我保护主要针对集群中网络出现问题,导致有很多实例无法发送心跳导致很多实例状态异常,但是实际实例还在正常工作的情况,不要让这些实例不参与负载均衡。
eureka:
server:
#注意,最好所有的客户端实例配置的心跳时间相关的配置,是相同的。这样使用自我保护的特性最准确。
#关闭自我保护
#我们这里不使用自我保护,因为:
#自我保护主要针对集群中网络出现问题,导致有很多实例无法发送心跳导致很多实例状态异常,但是实际实例还在正常工作的情况,不要让这些实例不参与负载均衡
#启用自我保护的情况下,就会停止对于实例的过期
#但是,如果出现这种情况,其实也代表很多实例无法读取注册中心了。
#并且还有一种情况就是,Eureka 重启。虽然不常见,但是对于镜像中其他的组件更新我们还是很频繁的
#我倾向于从客户端对于实例缓存机制来解决这个问题,如果返回实例列表为空,则使用上次的实例列表进行负载均衡,这样既能解决 Eureka 重启的情况,又能处理一些 Eureka 网络隔离的情况
#自我保护模式基于每分钟需要收到 renew (实例心跳)请求个数,如果启用了自我保护模式,只有上一分钟接收到的 renew 个数,大于这个值,实例过期才会被注销
enable-self-preservation: false
# 每分钟需要收到 renew (实例心跳)请求个数是需要动态刷新的,这个刷新间隔就是 renewal-threshold-update-interval-ms
#更新流程大概是:计算当前一共有多少实例,如果大于之前期望的实例量 * renewal-percent-threshold(或者没开启自我保护模式),则更新期望的实例数量为当前一共有多少实例
#之后根据期望的实例数量,计算期望需要收到的实例心跳请求个数 = 期望的实例数量 * (60 / expected-client-renewal-interval-seconds) * renewal-percent-threshold
#公式中 60 代表一分钟,因为公式用到了 expected-client-renewal-interval-seconds,也就是实例平均心跳间隔,为了使这个公式准确,最好每个实例配置一样的心跳时间
#默认 900000ms = 900s = 15min
renewal-threshold-update-interval-ms: 900000
#上面提到的实例平均心跳间隔,或者说是期望的心跳间隔,为了使这个公式准确,最好每个实例配置一样的心跳时间
#默认 30s
expected-client-renewal-interval-seconds: 30
#这个配置在两个地方被使用:
#如果启用用了自我保护,则会 renewal-threshold-update-interval-ms 指定的时间内,收到的心跳请求个数是否小于实例个数乘以这个 renewal-percent-threshold
#定时任务检查过期实例,每次最多过期 1 - renewal-percent-threshold 这么多比例的实例
renewal-percent-threshold: 0.85
上面我们提到了,同一区域内的 Eureka 服务器实例,收到的客户端请求,会转发到同一区域内的的其他 Eureka 服务器实例。同时,在某一 Eureka 服务器实例启动的时候,会从同一区域内其他 Eureka 服务器同步实例列表。并且,转发到其他 Eureka 服务器实例是异步转发的,这就有专门的线程池进行转发。同时,转发的也是 HTTP 请求,这就需要 HTTP 连接池:
eureka:
server:
#Eureka Server 从配置中更新同一区域内的其他 Eureka Server 实例列表间隔,默认10分钟
peer-eureka-nodes-update-interval-ms: 600000
#启动时从其他 Eureka Server 同步服务实例信息的最大重试次数,直到实例个数不为 0,默认为 0,这样其实就是不同步
registry-sync-retries: 0
#启动时从其他 Eureka Server 同步服务实例信息重试间隔
registry-sync-retry-wait-ms: 30000
#集群内至少有多少个 UP 的 Eureka Server 实例数量,当前 Eureka Server 状态为 UP。默认 -1,也就是 Eureka Server 状态不考虑 UP 的集群内其他 Eureka Server 数量。
min-available-instances-for-peer-replication: -1
#请求其他实例任务的最大超时时间,默认 30 秒
max-time-for-replication: 30000
#用来处理同步任务的线程数量,有两个线程池,一个处理批量同步任务,默认大小为20
max-threads-for-peer-replication: 20
#另一个处理非批量任务(如果没用 AWS Autoscaling 对接相关特性则没有啥用),默认大小为20
max-threads-for-status-replication: 20
#处理批量任务的线程池队列长度,默认为 10000
max-elements-in-peer-replication-pool: 10000
#处理非批量任务的线程池队列长度,默认为 10000
max-elements-in-status-replication-pool: 10000
#Eureka Server 通过 httpclient 访问其他 Eureka Server 同步实例,httpclient 的连接超时,默认 200ms
peer-node-connect-timeout-ms: 200
#httpclient 的读取超时,默认 200ms,一般不用太长
peer-node-read-timeout-ms: 200
#httpclient 的最大总连接数量,默认 1000
peer-node-total-connections: 1000
#httpclient 的对于某一 host 最大总连接数量,默认 500
peer-node-total-connections-per-host: 500
#httpclient 的连接空闲保持时间,默认 30s
peer-node-connection-idle-timeout-seconds: 30
Eureka 服务器会定时拉取其他区域的服务实例列表缓存在本地。在查询本地查询不到某个微服务的时候,就会查询这个远程区域服务实例的缓存。相关配置如下:
eureka:
server:
#请求其他 Region 的 httpclient 的连接超时,默认 1000ms
remote-region-connect-timeout-ms: 1000
#请求其他 Region 的 httpclient 的读取超时,默认 1000ms
remote-region-read-timeout-ms: 1000
#请求其他 Region 的 httpclient 的最大总连接数量,默认 1000
remote-region-total-connections: 1000
#请求其他 Region 的 httpclient 的对于某一 host 最大总连接数量,默认 500
remote-region-total-connections-per-host: 500
#请求其他 Region 的 httpclient 的连接空闲保持时间,默认 30s
remote-region-connection-idle-timeout-seconds: 30
#请求其他 Region 的 http 请求是否开启 gzip,对于其他 Region 我们认为网络连接是比较慢的,所以默认开启压缩
g-zip-content-from-remote-region: true
# remote-region-urls-with-name:
# region2eureka1: http://127:0:0:1:8212/eureka/
# region2eureka2: http://127:0:0:1:8213/eureka/
# remote-region-app-whitelist:
#如果需要从其他 Region 获取实例信息,这个获取间隔,默认为 30s
remote-region-registry-fetch-interval: 30
#如果需要从其他 Region 获取实例信息,这个任务的线程池,默认为 20个
remote-region-fetch-thread-pool-size: 20
Eureka 服务实例信息缓存配置
Eureka Server 在内存中存储所有服务实例信息,并且对于响应做了多层缓存。
eureka:
server:
# 增量实例队列实例过期时间,默认 3 分钟
retention-time-in-m-s-in-delta-queue: 180000
# 增量实例队列过期任务间隔,默认 30s
delta-retention-timer-interval-in-ms: 30000
# 响应缓存中有两个主要元素,一个是 readOnlyCacheMap,另一个是 readWriteCacheMap
# 是否使用 readOnlyCacheMap,默认为 true
# 如果为是,则从 readOnlyCacheMap 读取,否则直接读取 readWriteCacheMap
use-readonly-response-cahce: true
# 初始 readWriteCacheMap 大小,默认 1000
initial-capacity-of-response-cache: 1000
# LoadingCache 缓存过期时间,默认 180s
response-cache-auto-expiration-in-seconds: 9
# 定时从 LoadingCache 同步到只读缓存的间隔时间,默认为 30s
response-cache-update-interval-ms: 3000
我们这一节详细分析了 Eureka Server 相关的配置。下一节,我们将给大家提供一个配置模板,启动一个 Eureka Server 集群。
以上是关于SpringCloud升级之路2020.0.x版-19.Eureka的服务端设计与配置的主要内容,如果未能解决你的问题,请参考以下文章
SpringCloud升级之路2020.0.x版-7.从Bean到SpringCloud
SpringCloud升级之路2020.0.x版-44.避免链路信息丢失做的设计
SpringCloud升级之路2020.0.x版-41. SpringCloudGateway 基本流程讲解
SpringCloud升级之路2020.0.x版-22.Spring Cloud LoadBalan