十年架构设计总结!阿里华为等大厂都这么做容器调度和服务编排
Posted JavaEdge.
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了十年架构设计总结!阿里华为等大厂都这么做容器调度和服务编排相关的知识,希望对你有一定的参考价值。
- 镜像仓库
解决Docker镜像存储和访问 - 资源调度
决定Docker镜像可分发到哪些机器
这些解决后,就该考虑如何在集群中创建容器,即容器调度。
容器创建后如何运作才能对外提供服务,即容器调度。
1 容器调度
当服务需要发布的时候,该选择哪些机器部署容器。
若集群机器规模上百台,要发布的服务上百个,就不能靠人肉运维,需要有专门容器调度系统,所以很多基于Docker的容器调度系统,比如Swarm、Mesos。Kubernetes。
它们能解决哪些问题呢?
主机过滤
解决容器创建时什么样的机器可以使用:
-
存活过滤
必须选择存活的节点,因为主机也有可能下线、故障态。 -
硬件过滤
比如Web集群往往用作计算节点,它的CPU一般配置比较高
大数据集群往往用作数据存储,它的磁盘一般配置比较高
以上都是针对主机层次的过滤方式。
调度策略
为解决容器创建时选择哪些主机最合适,一般通过给主机打分。
比如Swarm包含两种类似策略:spread和binpack,都会根据每台主机的可用CPU、内存以及正在运行的容器的数量来给每台主机打分:
- spread策略
会选择一个资源使用最少的节点,以使容器尽可能的分布在不同的主机上运行。好处:可以使每台主机的负载都比较平均,而且如果有一台主机有故障,受影响的容器也最少 - binpack策略
正好相反,会选择一个资源使用最多的节点,好让容器尽可能的运行在少数机器上,节省资源的同时也避免了主机使用资源的碎片化
适用场景
各主机配置基本相同,使用也较简单,一台主机上只创建一个容器。每次创建容器时,直接从尚未创建过容器的主机中,随机选择一台。
某些在线、离线业务混布场景,为达到主机资源使用率最高,需综合考量容器中的任务特点:
- 在线业务主要使用CPU
- 离线业务主要使用磁盘和I/O
这两种业务的容器大部分情况下适合混跑在一起。
还有一种业务场景,主机资源都充足,每个容器只要划定所用资源限制,理论上跑在一起是没问题。但有时会出现对每个资源的抢占,比如都是CPU密集型或者I/O密集型的业务就不适合容器混布一台主机。
2 服务编排
服务依赖
若服务A调度的前提是先有服务B,容器调度时,就要考虑服务间这种依赖关系。
所以Docker提供Docker Compose。允许用户通过一个单独的docker-compose.yaml
定义一组相互关联的容器组成一个项目,以项目形式管理应用。
比如要实现一个Web项目,要创建:
就可以通过docker-compose.yaml
配置这个Web项目里包含的三个容器的创建。
服务发现
容器调度完成后,就可以启动了。但此时容器还不能对外服务,服务消费者并不知道这个新的节点,必须具备服务发现机制,使得新容器节点能够加入到线上服务。
常用的服务发现机制:
基于Nginx的服务发现
针对提供HTTP服务的。
当有新容器节点时,修改Nginx的节点list配置,然后利用Nginx的reload,重新读取配置,加载新节点。
基于注册中心的服务发现
针对提供RPC服务的。
当有新的容器节点时,需要调用注册中心提供的服务注册接口。使用这种方式时,如果服务部署在多个IDC,就要求容器节点分IDC进行注册,以便实现同IDC内就近访问。以微博的业务为例,微博服务除了部署在内部的两个IDC,还在阿里云上也有部署,这样的话,内部机房上创建的容器节点就应该加入到内部IDC分组,而云上的节点应该加入到阿里云的IDC。
弹性扩容
大部分互联网业务的访问呈现出访问时间的规律性。在高峰期,增加容器的数量,确保服务稳定性;低峰期减少容器数量,减少服务使用的资源成本。可以根据容器的CPU负载,设置一个扩缩容的容器数量或比例。比如可以设定容器的CPU使用率不超过50%,一旦超过这个使用率就扩一倍节点。
以上是关于十年架构设计总结!阿里华为等大厂都这么做容器调度和服务编排的主要内容,如果未能解决你的问题,请参考以下文章