cdh集群安装(入门)

Posted 大数据的未来

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了cdh集群安装(入门)相关的知识,希望对你有一定的参考价值。

cdh集群安装

1、  配置主机 vim/etc/hosts   (hadoop1,hadoop2,hadoop3)代表在3台机器执行操作

192.168.157.128hadoop1

192.168.157.129hadoop2

192.168.157.130 hadoop3

2、  关闭防火墙 (所有机器)

chkconfig iptables off

3、  ssh免密码登录(hadoop1执行)

ssh-keygen -t rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 600 ~/.ssh/authorized_keys

scp ~/.ssh/authorized_keys root@hadoop2:~/.ssh/

scp ~/.ssh/authorized_keys root@hadoop3:~/.ssh/

4、  安装mysql服务(hadoop1)

(1)    yum install mysql-server

(2)    service mysqld start

(3)    chkconfig mysqld on (设置开机启动)

(4)    查看服务是否启动chkconfig --list | grep mysqld

5、  配置mysql(hadoop1)

a)        配置mysql密码:mysqladmin -u root password 111111

b)        登录:mysql -u root –p 111111

c)        创建hive数据库: create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

d)        授权:grant all privileges on *.* to 'root'@'hadoop1' identified by'111111' with grant option;

e)        flush privileges;

6、  配置NTP服务,保障所有机器时间同步(hadoop1,hadoop2,hadoop3)

a)        查看ntp是否安装: rpm -q ntp

b)        所有节点安装: yum install ntp

c)        配置安装启动: chkconfig ntpd on

d)        查看服务: chkconfig --list ntpd

e)        同步时间: ntpdate -u 202.112.10.36 (这里可能是你公司的时间服务器吧,测试就用这个)

7、  设置ntp配置(hadoop1)

a)        vim /etc/ntp.conf 配置内容为:

server 202.112.10.36 prefer   (参照这个服务器)

b)        重启:service ntpd start

c)        查看状态:ntpdstat

8、  配置 vim/etc/ntp.conf  内容为:  server n1 (hadoop2,hadoop3)

9、  与hadoop1同步时间: ntpdate-u hadoop1  (hadoop2,hadoop3)

10、重启 service ntpdrestart   (hadoop2,hadoop3)

11、安装Cloudera ManagerServer(hadoop1)

       a)下载: wget http://archive.cloudera.com/cm5/cm/5/cloudera-manager-el6-cm5.3.3_x86_64.tar.gz

         b)解压tar -zxvf/soft/cloudera-manager-el6-cm5.3.3_x86_64.tar.gz

         c)将cloudera移动到/opt  mv cm-5.3.3/ /opt  mv cloudera /opt/

         d)修改权限 chown -Rroot:root /opt/cm-5.3.3   chown -Rroot:root /opt/cloudera

12、为Cloudera Manager5 建立数据库

         a)下载mysql官网的jdbc驱动(mysql-connector-java-5.1.33-bin)如果官网找不到,百度一下吧。

         b)将mysql-connector-java-5.1.33.jar放到/opt/cm-5.3.3/share/cmf/lib/目录下cpmysql-connector-java-5.1.33-bin.jar /opt/cm-5.3.3/share/cmf/lib/hive/lib/

         c)在主节点初始化CM5数据库/opt/cm-5.3.3/share/cmf/schema/scm_prepare_database.shmysql cm -hlocalhost -uroot -p111111 --scm-host localhost scm scm scm

(格式是:scm_prepare_database.sh数据库类型  数据库 服务器 用户名 密码  –scm-host  Cloudera_Manager_Server所在的机器)

         d)给所有节点添加cloudera-scm用户:(命令如下)

useradd --system --home=/opt/cm-5.3.3/run/cloudera-scm-server--no-create-home --shell=/bin/false --comment "Cloudera SCM User"cloudera-scm

13、Agent配置(hadoop1)

         a)修改配置vim /opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini server_host为主节点的主机名 内容为:   server_host=hadoop1

14、准备Parcels用以安装CDH5(配置源文件)(hadoop1)

         a)下载路径为:http://archive.cloudera.com/cdh5/parcels/5.3.3/

         b)将CHD5相关的Parcel包放到主节点的/opt/cloudera/parcel-repo/目录中(若无parcel-repo目录需要手动创建)

mv manifest.json  /opt/cloudera/parcel-repo/

mv CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1  /opt/cloudera/parcel-repo/

mv CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel  /opt/cloudera/parcel-repo/   

         c)重命名: mvCDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1 CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha

15、同步agent到其他节点(hadoop1)

         a)scp -r /opt/cm-5.3.3 root@hadoop2:/opt/

         b)scp -r /opt/cm-5.3.3 root@hadoop3:/opt/

16、启动相关脚本

         a)在namenode启动server和agent( 主节点也是要做到集群中的, 所以主节点也要开启Agent )   (hadoop1)

                   /opt/cm-5.3.3/etc/init.d/cloudera-scm-server start

                   /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start

         b)在所有datanode启动agent  (hadoop2,hadoop3)

                   /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start

17、登录界面 hadoop1:7180

18、选择免费版本ClouderExpress版

19、后面一步一步点(不想说了,出错看日志)

20、截一个图(代表成功吧)


注意:(1) Cloudera 建议将 /proc/sys/vm/swappiness 设置为 0。当前设置为 60。

使用 sysctl 命令在运行时更改该设置并编辑 /etc/sysctl.conf 以在重启后保存该设置。

您可以继续进行安装,但可能会遇到问题,Cloudera Manager 报告您的主机由于交换运行状况不佳。

以下主机受到影响:

在会受到影响的主机上执行echo 0 > /proc/sys/vm/swappiness命令即可解决。(在每一台机器执行)

 

本文写于20160423凌晨2点(哈哈,哥不是传说!!!!!!!!!!!!困了)

 

以上是关于cdh集群安装(入门)的主要内容,如果未能解决你的问题,请参考以下文章

适合国内网速的CDH5安装

CDH集群提交Spark作业原理及过程分析

CDH集群spark-shell执行过程分析

环境搭建-Hadoop集群搭建

优化cdh集群性能-可在安装集群前操作002

cdh集群安装(提高)