ubuntu 下安装伪分布式 hadoop
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ubuntu 下安装伪分布式 hadoop相关的知识,希望对你有一定的参考价值。
安装准备:
(1)hadoop安装包:hadoop-1.2.1.tar.gz
(2)jdk安装包:jdk-7u60-linux-i586.gz
(3)要是须要eclipse开发的话 还须要eclipse安装包 和eclipse和hadoop相关连的jar包。
安装:
(1)能够选择一个新建用户安装 也能够使用眼下账户。
![技术分享](https://image.cha138.com/20200618/30652968d09e4b648a97a35d33024819.jpg)
(2)规定 所属用户组:
![技术分享](https://image.cha138.com/20200618/f83e1f191e1c4ea5a7539270ac1afd72.jpg)
(3) 给予用户hadoop权限:
sudo vim /etc/sudoers 改动加入:![技术分享](http://img.blog.csdn.net/20141105154946349?</p><p>watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGRfMTIy/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
说到vim ubuntu本身自带的是vim tiny 不可用 须要使用的是vim full版本号 须要下载安装:
sudo apt-get remove vim-common
sudo apt-get install vim
vim 本身的一些配置可依据自己的喜好进行设置。
(4) 安装 jdk:
依据自己须要选择安装路径、
sudo mkdir /usr/java
tar -zxvf jdk-7u60-linux-i586.gz
mv jdk-1.7.0 jdk(改动名字 能够不设置(最好))
![技术分享](https://image.cha138.com/20200618/4ce0c3ce401f4eb5ac9ac73656c25c72.jpg)
删除安装包:
![技术分享](https://image.cha138.com/20200618/e22db6bc98d34481a5a87b5b4bacffbc.jpg)
(5) 配置jdk环境:
sudo vim /etc/profile 加入
![技术分享](https://image.cha138.com/20200618/7f0dfa3b72e6456995452fd70e28d32f.jpg)
更新一下(必须):source /etc/profile
測试一下:
![技术分享](https://image.cha138.com/20200618/be2bb741b82b4478a92655366851c256.jpg)
jdk 完毕。
(6) ssh 免password:
一般ssh-client 包括在ubuntu系统中,可是ssh-server并没有 安装,能够通过 ssh ip 測试下;
安装ssh-server: sudo apt-get install ssh
安装之后进行操作:
生成:
![技术分享](https://image.cha138.com/20200618/f20528bec2524983870eed90158d59c9.jpg)
![技术分享](https://image.cha138.com/20200618/21e04dc73e8948ca99b0062c444e2bb3.jpg)
![技术分享](https://image.cha138.com/20200618/ca429fb2d9224d919f1be6f53b204441.jpg)
ssh 能够登录。
(7) 安装hadoop
能够先创建一个hadoop到目录:
sudo mkdir /usr/hadoop
cd /usr/hadoop/
sudo tar -zxvf hadoop-1.2.1.tar.gz
sudo mv hadoop-1.2.1 hadoop
sudo chown -R hadoop:hadoop hadoop 将目录hadoop 读权限赋予hadoop用户
sudo rm -rf hadoop-1.2.1.tar.gz
安装之后须要进行配置:
配置 /etc/profile 加入:
sudo vim /etc/profile
![技术分享](https://image.cha138.com/20200618/801cb367654940af92f34362a0486b0e.jpg)
配置hadoop-env.sh文件:
sudo vim /usr/hadoop/conf/hadoop-env.sh:
建立一个目录:用于配置hadoop.tmp.dir參数:
sudo mkdir /usr/hadoop/tmp
配置核心文件:
core-site.xml:
![技术分享](https://image.cha138.com/20200618/9dcfa056be024406bd43027d684354ac.jpg)
hdfs-site.xml:
![技术分享](https://image.cha138.com/20200618/e6cc394682844d389f6b4b5234e109da.jpg)
mapred-site.xml:
![技术分享](https://image.cha138.com/20200618/f90970d3659d4876b58b1ed247863a22.jpg)
启动:因为前面配置 输入:
格式化节点:
hadoop namenode -format
启动:start-all.sh
jps 查看
停止:stop-all.sh
(8)安装eclipse
同上 先创建一个目录 解压安装....
![技术分享](https://image.cha138.com/20200618/d25246ef4ccb4af080e66c290cbbaf9d.jpg)
进去启动eclipse 遇到个小问题:
eclipse找不到jdk 或是jre
解决:
cd /home/hadoop/eclipse (安装eclipse)
sudo ln -sf $JRE_HOME jre
就是这个:
![技术分享](https://image.cha138.com/20200618/750ebfcc6c1240bb8c76a64c26d3785b.jpg)
进行eclipse 配置hadoop 将相关连的插件 拷贝到 eclipse下到plugins目录里面:
![技术分享](https://image.cha138.com/20200618/cdd9c9dd9ead4798b2774f544f6df74d.jpg)
启动 eclipse:
window->perferences:
hadoop的安装文件夹。
设置:
右键以下的空白区域:
![技术分享](https://image.cha138.com/20200618/48946a7705774d8ba232110d59399c0e.jpg)
出现:并配置
![技术分享](https://image.cha138.com/20200618/a7887b9eeb6847a5a422272a9a969574.jpg)
点开左側小象:
eclipse配置完毕。
以后能够在eclipse书写作业 然后到终端进行运行。
配置遇到的问题:
namenode datanode 没有起来:
解决例如以下:
(1)删除 /usr/hadoop/tmp
(2)在创建 : sudo mkdir /usr/hadoop/tmp
(3)删除 /tmp目录下 全部以hadoop开头的文件:
sudo rm -rf /tmp/hadoop*
(4)又一次格式化:
hadoop namenode -format
(5)启动
start-all.sh
以上是关于ubuntu 下安装伪分布式 hadoop的主要内容,如果未能解决你的问题,请参考以下文章
Hadoop在Ubuntu系统下伪分布式安装Hadoop,Spark和Hive
Ubuntu16.04 下 hadoop的安装与配置(伪分布式环境)
Ubuntu14.04或16.04下安装JDK1.8+Scala+Hadoop2.7.3+Spark2.0.2