Hadoop

Posted 2021-04-13 Help先生SmileyCaesar

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Hadoop相关的知识，希望对你有一定的参考价值。

前提

大数据系列文章：

如果把大数据比作白米饭的话，Hadoop就是盛饭的碗，而人工智能就是吃饭的筷子。随便逛逛知乎，会发现各种各样的英文简写，包括HDFS、MapReduce、HBase、Zookeepr、Hive、Pig、Sqoop、Avro 不禁发怵~ 这些都是Hadoop生态圈里的“组件”。

环境搭建

Linux安装

VMware Workstation Pro安装
Linux系统镜像【CentOS-6.5】

系统nat配置

虚拟机设置-网络连接-NAT模式
初始化设置【先改为“桥接模式”再改回“NAT模式”】
修改 /etc/sysconfig/network-scripts/ 下的ifcfg-eth0文件【Linux下的vim操作】并重启网络配置，之后用命令ifconfig验证是否配置成功。curl和ping百度检查能否上网
利用XShell终端远程登陆虚拟机Linux系统

Hadoop集群搭建

hadoop-1.2.1安装包

java-1.6

1. 配置三台主机作为一个集群【master|slave1|slave2】:复制master镜像作为slave1和slave2；

3. 给三台主机安装Java：利用Vmware设置共享目录共享hadoop及Java安装包；把安装包从 /mnt/hgfs/share_folder 拷贝到 /usr/local/src/下；进入目录运行安装命令；编辑Java环境变量（JAVA-HOME|CLASSPATH|PATH)；将Java安装包复制给另两台主机，作同样的配置。

4. 解压hadoop安装包；进入到hadoop目录下新建一个tmp文件夹；依次修改masters、slaves、core-site.xml、mapred-site.xml、hdfs-site.xml、hadoop-env.sh文件；配置本地网络配置，关联指定IP和主机（hostname)；将hadoop目录远程拷贝到slave1和slave2；做master同样的配置在slave1和slave2；关闭三台主机系统的防火墙,为了避免其他错误，方便排除执行命令【setenforce 0】；在每台机器上配置对方的公钥，这样在任一机器上通过ssh登陆其他机器不再需要密码；进入hadoop /bin目录下，先格式化【.hadoop namenode -format】,然后启动集群【./start-all.sh】,查看进程【jps】。

5. 查看目录【./hadoop fs -ls /】上传目录【./hadoop fs -put /etc/...】读取目录【.hadoop fs -cat /...】自此，hadoop环境搭建成功。

以上是关于Hadoop的主要内容，如果未能解决你的问题，请参考以下文章

hadoophadoop配置

HadoopHadoop mr wordcount基础

HadoopHadoop2.8编译

HadoopHadoop MR 自定义排序

HadoopHadoop概述

hadoophadoop 安装 kerberos