Hadoop 推测执行

Posted @SmartSi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop 推测执行相关的知识,希望对你有一定的参考价值。

1. 概述

Hadoop 不会去诊断或修复执行慢的任务,相反它会试图检测任务的运行速度是否比预期慢,并启动另一个等效任务作为备份(备份任务称为推测任务)。这个过程 在Hadoop 中被称为推测执行

在这篇文章中,我们将讨论推测执行 - Hadoop 中提高效率的一个重要功能,我们有必要去了解 Hadoop 中的推测执行是否总是有帮助的,或者我们需要关闭它时如何禁用。

2. 什么是推测执行

Hadoop 中,MapReduce 将作业分解为任务,并且这些任务并行而不是顺序地运行,从而缩短了总体执行时间。这种执行模式对缓慢的任务很敏感(即使他们的数量很少),因为它们减慢了整个工作的执行速度。

任务执行缓慢的原因可能有各种,包括硬件退化或软件错误配置等,尽管花费的时间超过了预期的时间,但是由于任务仍然有可能成功完成,因此很难检测缓慢的原因。Hadoop 不会尝试诊断和修复运行缓慢的任务,而是尝试检测并为其运行一个备份任务。这在 Hadoop 中被称为推测执行。这些备份任务在 Hadoop 中被称为推测任务。

3. 推测执行如何工作

现在让我们看看 Hadoop 的推测执行过程。

首先,在 Hadoo

以上是关于Hadoop 推测执行的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop学习19--推测式执行

Hadoop推测任务执行

整理的一点面试题

整理的一点面试题

大数据面试题:Yarn核心高频面试题

Hadoop中的Speculative Task调度策略