hive学习笔记_hive的介绍与安装

Posted 呢喃的歌声

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive学习笔记_hive的介绍与安装相关的知识,希望对你有一定的参考价值。

一、什么是Hive

Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

二、Hive的体系结构

下图一为官网提供的hive体系结构。

 

技术分享

从体系结构上看,Hive是建立在 Hadoop 上的数据仓库基础构架。

1、hive的用户接口为:CLI,Hiveserver,WebUI。

 ①CLI为命令行客户端或者说是 命令行环境,客户端可以直接在命令行模式下进行操作。

   ②Hiveserver支持jdbc/odbc方式,Hive提供了Thrift服务,Thrift客户端目前支持C++/Java/php/Python/Ruby。

   ③webGUI接口,让hive提供了更加直观的web操作页面。但是处理大量数据的时候,不推荐使用。

2、Metastore 元数据存储,存储Hive所有的表与分区的结构化信息,包括列与列类型信息,序列化器与反序列化器,从而能够读写hdfs中的数据。

 有三种存储方式。

   ①内嵌Derby方式

   ②Local方式

   ③Remote方式

   关于三种存储方式,会在以后的博文中详细介绍。

3、Hadoop与Hive的关系

  Hive是Hadoop的一个组件,作为数据厂库,Hive的数据是存储在Hadoop的文件系统中的,hive为Hadoop提供SQL语句,是Hadoop可以通过SQL语句操作文件系统中的数据。hive是依赖Hadoop而存在的。

     在网上下载了一张图片,很明了的介绍了他们之间的关系,如下图:

技术分享

     

三、Hive的安装

  1,打开服务向导,选择安装Hive,在安装Hive之前,请安装好MapReduce。如下图

  技术分享

  2,首先我们会看到,我们会为hive选择一组依赖关系。

  技术分享

  3,自定义分配角色,根据实际情况,去分配角色。

  技术分享

  4,选择数据库,可以选选择嵌入式数据库,后期再去改。

  技术分享

  测试连接,如果成功,点击继续。

  5,安装进度。

  技术分享

以上是关于hive学习笔记_hive的介绍与安装的主要内容,如果未能解决你的问题,请参考以下文章

学习笔记Hive—— Hive安装配置

Hadoop学习笔记-009-CentOS_6.5_64_HA高可用-Hadoop2.6+Zookeeper3.4.5安装Hive1.1.0

Hive 系统性学习笔记

Hive 系统性学习笔记

Hive学习笔记

Hive学习笔记