Hadoop可以运行的模式

Posted 2023-03-25

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hadoop可以运行的模式相关的知识，希望对你有一定的参考价值。

1、单机（本地）模式：这种模式在一台单机上运行，没有分布式文件系统，而是直接读写本地操作系统的文件系统。在单机模式（standalone）中不会存在守护进程，所有东西都运行在一个JVM上。这里同样没有DFS，使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序，这也是最少使用的一个模式。

2、伪分布式模式：也是在一台单机上运行，但用不同的Java进程模仿分布式运行中的各类结点(NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode)，伪分布式（Pseudo）适用于开发和测试环境，在这个模式中，所有守护进程都在同一台机器上运行。

3、全分布式模式：全分布模式通常被用于生产环境，使用N台主机组成一个Hadoop集群，Hadoop守护进程运行在每台主机之上。这里会存在Namenode运行的主机，Datanode运行的主机，以及tasktracker运行的主机。在分布式环境下，主节点和从节点会分开。

扩展资料：

Hadoop 的最常见用法之一是 Web 搜索。虽然它不是唯一的软件框架应用程序，但作为一个并行数据处理引擎，它的表现非常突出。Hadoop 最有趣的方面之一是 Map and Reduce 流程，它受到Google开发的启发。

这个流程称为创建索引，它将 Web爬行器检索到的文本 Web 页面作为输入，并且将这些页面上的单词的频率报告作为结果。然后可以在整个 Web 搜索过程中使用这个结果从已定义的搜索参数中识别内容。

参考技术A 1、单节点，单个电脑节点
2、伪集群，单个电脑模拟集群的方式
3、集群分布式，不同的主机上，集群访问（namenode，datanode，在不同的服务器（ip））

以上是关于Hadoop可以运行的模式的主要内容，如果未能解决你的问题，请参考以下文章

Hadoop三种运行模式详解

Hadoop运行模式

大数据 hadoop 三种运行模式的区别、及详细配置讲解

如何在以伪分布式模式安装的Hadoop中运行Nutch

我把hadoop安装在不能上网的电脑上，请问hadoop的编译运行不联网能操作吗？大谢

老师，IDEA如何在本地运行和调试Hadoop程序？