Hive环境搭建 | 数据仓库工具搭建详细过程

Posted 大数据小禅

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive环境搭建 | 数据仓库工具搭建详细过程相关的知识,希望对你有一定的参考价值。

🚀 作者 :“大数据小禅”
🚀 简介:详解数据仓库工具Hive的搭建过程
🚀 安装包|文档获取:获取对应的安装包可以通过最下方公众号联系我备注获取。

1.Hive简介

hive是基于Hadoop的一个数据仓库的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。

Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门MapReduce应用程序。

2.环境Hive安装

1.前置环境

对应的安装包可以再公众号我获取。在安装Hive之前,需要先确保Hadoop与mysql是正常启动的,Hadoop与MySQL的搭建可以参[环境搭建的系列文章。

2.解压安装包

这里我们在node1节点上安装Hive,将安装包解压放在app目录下

#解压
tar -zxvf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /app
#修改别名
mv apache-hive-3.1.2-bin hive-3.1.2

3.添加环境变量

vim /etc/profile 
#添加下面两行
export HIVE_HOME=/app/hive-3.1.2
export PATH=$PATH:$HIVE_HOME/bin

#source /etc/profile

4.解决日志的Jar包冲突

cd /app/hive-3.1.2/lib
mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.jar.bak

5.拷贝MySQL的JDBC驱动到Hive

#没有安装包的可以搜索下载也可以私聊我获取
cp mysql-connector-java-5.1.27.jar /app/hive-3.1.2

6.配置Metastore

在/app/hive-3.1.2/conf目录下新建hive-site.xml文件 vim hive-site.xml添加如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://node1:3306/metastore?useSSL=false</value>
    </property>

    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
    </property>

    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>

    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>123456</value>
    </property>

    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/user/hive/warehouse</value>
    </property>

    <property>
        <name>hive.metastore.schema.verification</name>
        <value>false</value>
    </property>

    <property>
    <name>hive.server2.thrift.port</name>
    <value>10000</value>
    </property>

    <property>
        <name>hive.server2.thrift.bind.host</name>
        <value>node1</value>
    </property>

    <property>
        <name>hive.metastore.event.db.notification.api.auth</name>
        <value>false</value>
    </property>
    
    <property>
        <name>hive.cli.print.header</name>
        <value>true</value>
    </property>

    <property>
        <name>hive.cli.print.current.db</name>
        <value>true</value>
    </property>
</configuration>

7.登录MySQL创建对应数据库

 create database metastore;

8.初始化Hive元数据库

#运行命令
schematool -initSchema -dbType mysql -verbose

9.启动Hive查看是否安装成功

启动命令为 “hive”

以上是关于Hive环境搭建 | 数据仓库工具搭建详细过程的主要内容,如果未能解决你的问题,请参考以下文章

Hive环境搭建 | 数据仓库工具搭建详细过程

Spark环境搭建-----------数据仓库Hive环境搭建

基于docker快速搭建hive环境

Hive数仓项目架构说明环境搭建及数据仓库基础知识

大数据环境搭建- hive客户端安装

分析用Hive搭建数据仓库