3(Hive)

Posted dongchao3312

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3(Hive)相关的知识,希望对你有一定的参考价值。

1,简介

Hive : 数据仓库。
Hive:解释器,编译器,优化器等。
Hive 运行时,元数据存储在关系型数据库里面

2,架构

(1)用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至Hive Server。在启动 Client模式的时候,需要指出Hive Server所在节点,并且在该节点启动Hive Server。 WUI是通过浏览器访问Hive。

(2)Hive将元数据存储在数据库中,如mysql、derby(hive自带内存数据库)。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。   

(3)解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行。 

(4)Hive的数据存储在HDFS中,大部分的查询、计算由MapReduce完成(包含*的查询,比如select * from tbl不会生成MapRedcue任务)

技术图片

 

 客户端请求到driver,现在去数据库查看元数据,存在就解析编译,然后执行mapreduce

以上是关于3(Hive)的主要内容,如果未能解决你的问题,请参考以下文章

3. Hive分布式数据仓库华为HCIA-BigData

Hadoop搭建Hive

Hive 学习 hive安装

Hive-3.1.3安装配置MYSQL元数据存储

Hive-3.1.2详细安装步骤

hive安装