4 weekend110的hive入门
Posted 大数据和人工智能躺过的坑
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4 weekend110的hive入门相关的知识,希望对你有一定的参考价值。
Hive和HBase都很重要,当然啦,各自也有自己的替代品。
在公司里,SQL有局限,大部分时候,不需写mr程序的,用hive这个工具。
公司里的懂java开发员工不一定每个公司都有,但懂SQL开发员工很多。
Hive的替代品:impala、spark shark、spark sql…
Hive、impala 、spark shark、spark sql l…。相比,Hive是最慢的,因为,它是依赖mapreduce框架。
Hive是把SQL语言,翻译成mapreduce程序。
Spark sql是把SQL语言,翻译成spark程序。
注意啊,hive只是一个工具,你给它一个SQL程序,它就翻译成mapreduce程序,提交给集群去运行。
在一个节点上,安装一个hive、两个hive、三个hive、、、
以上是weekend110的hive入门
以上是关于4 weekend110的hive入门的主要内容,如果未能解决你的问题,请参考以下文章
4 weekend110的textinputformat对切片规划的源码分析 + 倒排索引的mr实现 + 多个job在同一个main方法中提交
4 weekend110的hdfs下载数据源码跟踪铺垫 + hdfs下载数据源码分析-getFileSystem(值得反复推敲和打断点源码)