设置hadoop集群

Posted

技术标签:

【中文标题】设置hadoop集群【英文标题】:Setting up hadoop cluster 【发布时间】:2014-05-14 15:46:13 【问题描述】:

hadoop 集群中的工作节点是否需要在每个节点上安装 hadoop?

如果我只需要一些PC的计算能力,我可以只使用map-reduce而不在每个节点上安装HDFS吗?

【问题讨论】:

【参考方案1】:

当您说工作节点时,它包括 DataNodes 和 TaskTracker。因此,从这个意义上说,如果您希望运行 MR 作业,您需要在每台机器上使用它们。

但这里的重点是你会单独使用 MR 做什么。我的意思是对存储在本地 FS 中的数据运行 MR 作业不会有太大用处,因为在这种情况下您无法利用 Hadoop 提供的分布式数据存储和并行性的强大功能。

【讨论】:

【参考方案2】:

要使用节点的计算能力,您需要在该节点上运行 TaskTracker。因此,必须安装 Hadoop。

如果不需要HDFS,可以只运行TaskTracker,不启动DataNode。

【讨论】:

以上是关于设置hadoop集群的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop 机架(集群拓扑)设置

hadoop设置的hadoop heap size是根据集群中的每一台机子配置而在那台机子上设置适合它的值吗?

Hadoop集群(第7期)_Eclipse开发环境设置

Hadoop高手之路2—Hadoop集群的基础设置

Hadoop集群搭建

hadoop-集群管理——内存设置