分布式调度系统现状

Posted mesakii

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式调度系统现状相关的知识,希望对你有一定的参考价值。

来自于阿里云

https://edu.aliyun.com/course/31/learn?spm=5176.8764728.0.0.qDnlmZ#lesson/618

课时一:分布式调度系统的现状

分布式调度的两大任务:任务调度和资源调度

任务调度:大量的计算任务、任务如何让切分、数据如何分割运算、监控运算状态

资源调度:供给方、不同业务间的平衡资源、支持优先级抢占

 

分布式调度系统:Hadoop MR(map reduce) ,YARN, Mesos, Aliyun-Fuxi

hadoop的map-reduce 典型的主从关系,存在的问题是 规模扩展存在瓶颈,

1.每增加一个节点,task_track注册到job_track就要加载新的内存

2.容错性差,Job Tracker 单点没有failover 一旦宕机,就会造成信息丢失

3.不利于功能扩展,不同任务采用不同的调度策略

 

很难做到热拔插(不停止进程的情况下改变系统的调度行为)

YARN:

区别(与hadoop)

1.将资源调度与任务调度进行区分

2.可以支撑更大的计算规模

 

缺陷:

1.只支持内存维度的分配

2.资源的交互性能

 

{调度是一个背包问题:

考虑内存时,调度是一维线性规划,

增加资源时,调度是高维背包问题

所以YARN仅支持内存维度的问题

}

 

以上是关于分布式调度系统现状的主要内容,如果未能解决你的问题,请参考以下文章

《分布式技术原理与算法解析》学习笔记Day10

单集群10万节点 走进腾讯云分布式调度系统VStation

一款你不得不了解的轻量级分布式任务调度系统

如何快速低成本开发功能强大的分布式任务调度系统

Python使用multiprocessing实现一个最简单的分布式作业调度系统

开源分布式任务调度系统就选:DolphinScheduler