2021年大数据环境搭建:​​​​​​​​​​​​​​​​​​​​​Hadoop编译

Posted Lansonli

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2021年大数据环境搭建:​​​​​​​​​​​​​​​​​​​​​Hadoop编译相关的知识,希望对你有一定的参考价值。

目录

Hadoop编译

一、准备linux环境

​​​​​​​二、安装maven

​​​​​​​三、安装findbugs

​​​​​​​四、在线安装一些依赖包

​​​​​​​五、安装protobuf

​​​​​​​六、安装snappy

​​​​​​​七、编译hadoop源码


Hadoop编译

​​​​​​​一、准备linux环境

准备一台linux环境,内存4G或以上,硬盘40G或以上,我这里使用的是Centos7.7 64位的操作系统(注意:一定要使用64位的操作系统),需要虚拟机联网,关闭防火墙,关闭selinux,安装好JDK8。

根据以上需求,只需要将node1再克隆一台即可,命名为node4,专门用来进行Hadoop编译。

 

​​​​​​​二、安装maven

这里使用maven3.x以上的版本应该都可以,不建议使用太高的版本,强烈建议使用3.0.5的版本即可

将maven的安装包上传到/export/software

然后解压maven的安装包到/export/server

cd /export/software/

tar -zxvf apache-maven-3.0.5-bin.tar.gz -C ../server/

配置maven的环境变量


vim /etc/profile

 

填写以下内容


export MAVEN_HOME=/export/server/apache-maven-3.0.5

export MAVEN_OPTS="-Xms4096m -Xmx4096m"

export PATH=:$MAVEN_HOME/bin:$PATH

让修改立即生效

source /etc/profile

解压maven的仓库

tar -zxvf mvnrepository.tar.gz  -C /export/server/

修改maven的配置文件

cd  /export/server/apache-maven-3.0.5/conf

vim settings.xml

指定我们本地仓库存放的路径

 <localRepository>/export/server/mavenrepo</localRepository>

添加一个我们阿里云的镜像地址,会让我们下载jar包更快

<mirror>

      <id>alimaven</id>

      <name>aliyun maven</name>

      <url>http://maven.aliyun.com/nexus/content/groups/public/</url>

      <mirrorOf>central</mirrorOf>

</mirror>

 

 

​​​​​​​三、安装findbugs

解压findbugs

tar -zxvf findbugs-1.3.9.tar.gz -C ../server/

配置findbugs的环境变量

vim /etc/profile

添加以下内容:

export MAVEN_HOME=/export/server/apache-maven-3.0.5

export PATH=:$MAVEN_HOME/bin:$PATH



export FINDBUGS_HOME=/export/server/findbugs-1.3.9

export PATH=:$FINDBUGS_HOME/bin:$PATH

让修改立即生效

source  /etc/profile

 

​​​​​​​四、在线安装一些依赖包

yum -y install autoconf automake libtool cmake

yum -y install ncurses-devel

yum -y install openssl-devel

yum -y install lzo-devel zlib-devel gcc gcc-c++

yum -y install  bzip2-devel

 

​​​​​​​五、安装protobuf

解压protobuf并进行编译

cd  /export/software

tar -zxvf protobuf-2.5.0.tar.gz -C ../server/

cd   /export/server/protobuf-2.5.0

./configure

make && make install

 

​​​​​​​六、安装snappy

cd /export/software/

tar -zxvf snappy-1.1.1.tar.gz  -C ../server/

cd ../server/snappy-1.1.1/

./configure

make && make install

 

​​​​​​​七、编译hadoop源码

对源码进行编译

cd  /export/software
tar -zxvf hadoop-2.7.5-src.tar.gz  -C ../server/
cd  /export/server/hadoop-2.7.5

编译支持snappy压缩:

mvn package -DskipTests -Pdist,native -Dtar -Drequire.snappy -e -X

编译完成之后我们需要的压缩包就在下面这个路径里面,生成的文件名为hadoop-2.7.5.tar.gz

cd /export/server/hadoop-2.7.5/hadoop-dist/target

将编译后的Hadoop安装包导出即可

以上是关于2021年大数据环境搭建:​​​​​​​​​​​​​​​​​​​​​Hadoop编译的主要内容,如果未能解决你的问题,请参考以下文章

2021年大数据Hadoop:全网最详细的Hadoop集群搭建

2021年大数据Hadoop(十四):HDFS的高可用机制

2021年大数据ZooKeeper:ZooKeeper集群搭建

2021年大数据Kafka:❤️Kafka的集群搭建以及shell启动命令脚本编写❤️

2021年大数据Kafka:❤️Kafka的集群搭建以及shell启动命令脚本编写❤️

2021年大数据ELK:Elasticsearch编程(环境准备)