4 weekend110的hive入门

Posted 大数据和人工智能躺过的坑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4 weekend110的hive入门相关的知识,希望对你有一定的参考价值。

Hive和HBase都很重要,当然啦,各自也有自己的替代品。

 

技术分享

技术分享

 

 技术分享

 

 

在公司里,SQL有局限,大部分时候,不需写mr程序的,用hive这个工具。

 

公司里的懂java开发员工不一定每个公司都有,但懂SQL开发员工很多。

 

Hive的替代品:impala、spark shark、spark sql…

 

Hive、impala 、spark shark、spark sql l…。相比,Hive是最慢的,因为,它是依赖mapreduce框架。

Hive是把SQL语言,翻译成mapreduce程序。

Spark sql是把SQL语言,翻译成spark程序。

 

 技术分享

技术分享

技术分享

技术分享

技术分享

 

注意啊,hive只是一个工具,你给它一个SQL程序,它就翻译成mapreduce程序,提交给集群去运行。

在一个节点上,安装一个hive、两个hive、三个hive、、、

 

技术分享

技术分享

以上是weekend110的hive入门

以上是关于4 weekend110的hive入门的主要内容,如果未能解决你的问题,请参考以下文章

4 weekend110的textinputformat对切片规划的源码分析 + 倒排索引的mr实现 + 多个job在同一个main方法中提交

4 weekend110的hdfs下载数据源码跟踪铺垫 + hdfs下载数据源码分析-getFileSystem(值得反复推敲和打断点源码)

Hive入门

Hive入门

Hive入门

1 weekend110的hdfs源码跟踪之打开输入流 + hdfs源码跟踪之打开输入流总结