Hive -- 原理篇

Posted z1141000271

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive -- 原理篇相关的知识,希望对你有一定的参考价值。

前言

  一个简单的理解:把SQL的一些操作应用在hadoop的HDFS上面。

数据库与数据仓库

  数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。

  数据仓库:数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

  数据库里面有个范式的概念,也就是说数据库中的数据是没有冗余的,用于企业的一些应用。数据仓库是存在冗余数据的,主要用来对大规模的数据及进行数据分析,用户数据挖掘、数据分析。

Hive的架构

技术图片

 

 

技术图片

 

 

技术图片

 

 Hive的三种模式

技术图片

 

 技术图片

 

 技术图片

 

以上是关于Hive -- 原理篇的主要内容,如果未能解决你的问题,请参考以下文章

hive基础指南(精华篇)

Spark SQL优化之路——Hive篇

Hive 入门学习线路指导

图解Hive文件存储格式

随笔篇-ThreadLocal原理分析

Kafka原理篇:图解kakfa架构原理