Ubuntu下安装Hive3.1.2教程(附MySQL安装方法及安装包)

Posted Z.Q.Fengᯤ⁵ᴳ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu下安装Hive3.1.2教程(附MySQL安装方法及安装包)相关的知识,希望对你有一定的参考价值。


前言

Hive 的安装需要建立在 Hadoop 的之上(类似于Hbase),关于 Hadoop 的单机安装以及伪分布式安装可以参考作者的另两篇博客:

本文安装的 Hadoop 及 Java 环境基于林子雨老师的《大数据技术原理与应用(第3版)》中所要求,其中 Java 版本为1.8.0_301Hadoop 版本为3.2.2,这里我的操作系统环境是 Ubuntu 20.04,此安装方法同样适用于低版本。


一、安装Hive

1. 下载压缩包并解压

官网下载目录如下:https://dlcdn.apache.org/hive/

下载文件如下:apache-hive-3.1.2-bin.tar.gz,进入下载目录,解压压缩包:

cd ~/Downloads
sudo tar -zxvf ./apache-hive-3.1.2-bin.tar.gz -C /usr/local 

2. 安装Hive

进入到 /usr/local 目录下,更改文件夹名,赋予用户权限:

cd /usr/local
sudo mv apache-hive-3.1.2-bin hive     
sudo chown -R hadoop ./hive

3. 配置环境变量

修改 ~/.bashrc 文件:

vim ~/.bashrc

增添下面几行:

export HIVE_HOME=/usr/local/hive
export PATH=$PATH:$HIVE_HOME/bin
export HADOOP_HOME=/usr/local/hadoop

运行如下命令使配置立即生效:

source ~/.bashrc

4. 修改配置文件

修改配置 hive-default.xml 文件:

cd /usr/local/hive/conf
sudo mv hive-default.xml.template hive-default.xml

新建 hive-site.xml 文件:

sudo vim hive-site.xml

将以下内容写入文件:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.cj.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hive</value>
    <description>username to use against metastore database</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>hive</value>
    <description>password to use against metastore database</description>
  </property>
  <property>
    <name>datanucleus.autoCreateTables</name>
    <value>True</value>
  </property>
</configuration>

按下 ESC 键,:wq,保存并退出。


二、MySQL安装与配置

1. 安装MySQL

参考我的这篇博客安装最新版本的 MySQL:Ubuntu20.04安装MySQL及配置MySQL workbench

2. 安装MySQL jdbc包

上述博客安装的 MySQL 版本为 8.0.27,所以我们需要下载对应版本的 MySQL jdbc 包,下载链接如下:mysql-connector-java-8.0.27.tar.xz

下载好后,提取 mysql-connector-java-8.0.27-bin.jar 包到指定路径:

cd ~/Downloads
tar -zxvf mysql-connector-java-8.0.27.tar.gz   #解压
cp mysql-connector-java-8.0.27/mysql-connector-java-8.0.27-bin.jar  /usr/local/hive/lib

3. 为Hive创建MySQL账号

启动 MySQL 服务,登录 shell:

service mysql start #启动mysql服务
sudo mysql -u root -p  #登陆shell界面

新建 hive 数据库:

mysql> CREATE DATABASE hive;
Query OK, 1 row affected (0.02 sec)

创建用户 hive,设置密码(这里根据配置文件设置为 hive),使其能连接上 hive 数据库:

mysql> create user 'hive'@'%' identified by  'hive';
Query OK, 0 rows affected (0.03 sec)

mysql> grant all privileges on hive.* to 'hive'@'%' with grant option;
Query OK, 0 rows affected (0.02 sec)

mysql> flush privileges;
Query OK, 0 rows affected (0.02 sec)

mysql>

这里若提示密码不符合,则先执行以下命令,再执行上述命令:

mysql> set global validate_password.policy=LOW;
Query OK, 0 rows affected (0.01 sec)

mysql> set global validate_password.length=4;
Query OK, 0 rows affected (0.00 sec)

mysql>

三、验证Hive安装及错误处理

1. 启动Hadoop

cd /usr/lcoal/hadoop
sbin/start-dfs.sh

2. 启动hive

cd /usr/lcoal/hive
./bin/schematool -dbType mysql -initSchema
bin/hive

正常启动会出现一个交互界面如下:

hive>

启动若出现如下报错:

Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

查看此篇博客:Hive启动报错:java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument

3. 运行Hive实例

在 hive 交互界面下,运行以下命令:

hive> create database if not exists hive; #创建数据库
OK
Time taken: 0.59 seconds

hive> show databases; #查看Hive中包含数据库
OK
datazq
default
hive
Time taken: 0.148 seconds, Fetched: 3 row(s)

hive> show databases like 'h.*'; #查看Hive中以h开头数据库
OK
hive
Time taken: 0.04 seconds, Fetched: 1 row(s)

hive>

总结

采用Hive实现最大的优势是,对于非程序员,不用学习编写Java MapReduce代码了,只需要用户学习使用HiveQL就可以了,而这对于有SQL基础的用户而言是非常容易的。

以上是关于Ubuntu下安装Hive3.1.2教程(附MySQL安装方法及安装包)的主要内容,如果未能解决你的问题,请参考以下文章

八hive3.1.2 安装及其配置(本地模式和远程模式)

基于Hadoop3.1.2集群的Hive3.1.2安装(有不少坑)

Ubuntu20.04 下 rstudio 安装教程(附安装包下载)

Ubuntu20.04 下 rstudio 安装教程(附安装包下载)

Hive3.1.2安装指南

安装Hive3.1.2