Fork/Join 和 Map/Reduce 的区别
Posted
技术标签:
【中文标题】Fork/Join 和 Map/Reduce 的区别【英文标题】:Difference between Fork/Join and Map/Reduce 【发布时间】:2011-02-02 01:15:50 【问题描述】:Fork/Join 和 Map/Reduce 的主要区别是什么?
它们的分解和分布类型(数据与计算)是否不同?
【问题讨论】:
【参考方案1】:一个关键的区别是F-J 似乎被设计为在单个Java VM 上工作,而M-R 被明确设计为在大型机器集群上工作。这些是非常不同的场景。
F-J 提供了以递归方式将任务划分为多个子任务的功能;更多的层,在这个阶段“叉间”通信的可能性,更传统的编程。不延伸(至少在论文中)超出单台机器。非常适合利用您的八核。
M-R 只进行一次大拆分,映射的拆分彼此之间根本不交谈,然后将所有内容减少在一起。单层,在减少之前没有拆分间通信,并且可大规模扩展。非常适合利用您的云份额。
【讨论】:
更具体地说,F-J 允许工作人员从彼此的队列中窃取子任务。如果工作线程在不同的机器上(因此没有共享内存),这是不可能的。 根据MapReduce Wikipedia entry 的说法,M-R 不一定限于单层分叉任务。 在 Java 上下文之外的 fork/join 和 mapreduce 有什么区别?【参考方案2】:有一篇关于这个主题的完整科学论文,Comparing Fork/Join and MapReduce。
本文比较了三种并行范例的性能、可扩展性和可编程性:fork/join、MapReduce 和混合方法。
他们发现基本上 Java fork/join 具有较低的启动延迟,并且可以很好地适应小输入 (100MB)。
但如果你愿意的话,这里还有很多内容可以阅读。
【讨论】:
以上是关于Fork/Join 和 Map/Reduce 的区别的主要内容,如果未能解决你的问题,请参考以下文章
线程基础:多任务处理(13)——Fork/Join框架(解决排序问题)