再见了 HDFS!这个资源调度框架已成气候!

Posted java思维导图

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再见了 HDFS!这个资源调度框架已成气候!相关的知识,希望对你有一定的参考价值。

这两天有粉丝问我,在一个成熟大数据系统中,最不能缺少的核心是什么?

我仔细思考了一下,是消息系统之王的 Kafka 吗?不,还有  RocketMQ 和 Pulsar 可以选

是人人都会接触的协调系统 Zookeeper 吗?也未必, Redis 如日中天!

大数据技术栈一览

接下来,我顺着一个成熟大数据系统的工作模式反复考虑,最终有了结论:任何一个分布式程序执行,都需要从系统申请资源。

我认为,大数据系统的核心是  Hadoop 集群中的资源管理模块——YARN!

01
分布式资源调度引擎 YARN


YARN 从 Hadoop 2.0 之后被引入,一经推出,便迅速成为最受欢迎的分布式资源调度框架,负责管理集群中的全部资源,以及调度运行在YARN之上的各种计算任务。


像 HDFS 的核心组件一样,YARN 同样是主从结构,核心是Resource Manager、NodeManager、ApplicationMaster、Container 组件。


再见了 HDFS!这个资源调度框架已成气候!

YARN 的实现逻辑与基本架构


YARN 的功能非常强大,但实现原理也非常复杂。JobTracker、TaskTracker模型的最大缺陷是扩展性差,YARN 利用 Resource Manager 解耦后分而治之,大大提升了扩展性。


02


大厂为什么重视 YARN


基于 Hadoop 构建大数据生态的公司集群规模一般都很大,主要是 BATJ 华为等一线互联网大厂,而 Hadoop 最核心的 3 大部分就是  HDFS、YARN、MapReduce

YARN 自从诞生开始,就越来越被大量企业作为大数据领域核心基础平台使用,掌握了 YARN 就等于掌握了 Hadoop 的核心,也就拥有了大数据领域的核心竞争力!


再见了 HDFS!这个资源调度框架已成气候!



Hadoop 3 大核心组件

最近我一直在补 Hadoop 生态的核心原理,这里推荐一门刚撸完的独家好课,由前58技术委员会主席孙玄,结合10多年一线大厂实践经验,打造的 源码级剖析分布式资源调度引擎 YARN 内核 在线专栏。 3  天时间,12节干货,带你从大数据高峰视角,彻底看透 YARN 的内核设计本质。

再见了 HDFS!这个资源调度框架已成气候!


原价 ¥ 499 限时  ¥0.99 立刻学习!

再见了 HDFS!这个资源调度框架已成气候!

长按扫码

以上是关于再见了 HDFS!这个资源调度框架已成气候!的主要内容,如果未能解决你的问题,请参考以下文章

yarn和mapreduce资源调优

再见,Spark!Flink已成气候!

再见,Kafka!RocketMQ已成气候!

再见了数据仓库!数据中台已成气候!

再见了微服务,DDD已成气候!

再见了微服务,DDD已成气候!