黑猴子的家:Spark on hive 与 hive on spark 的区别

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了黑猴子的家:Spark on hive 与 hive on spark 的区别相关的知识,希望对你有一定的参考价值。

参考技术A 是spark 通过Spark-SQL使用hive 语句,操作hive ,底层运行的还是 spark rdd.
(1)就是通过sparksql,加载hive的配置文件,获取到hive的元数据信息
(2)spark sql获取到hive的元数据信息之后就可以拿到hive的所有表的数据
(3)接下来就可以通过spark sql来操作hive表中的数据

是把hive查询从mapreduce 的mr (Hadoop计算引擎)操作替换为spark rdd(spark 执行引擎) 操作. 相对于spark on hive,这个要实现起来则麻烦很多, 必须重新编译你的spark和导入jar包,不过目前大部分使用的是spark on hive

黑猴子的家:Centos 7.x 安装 PyCharm 2021.3 并创建桌面图标

参考技术A 友情提示:想安装试一下的朋友,可以先使用2020版本

尖叫提示:Python不是必须的,系统自带一个PyCharm也带着

这样以后就可以在桌面双击打开了

以上是关于黑猴子的家:Spark on hive 与 hive on spark 的区别的主要内容,如果未能解决你的问题,请参考以下文章

黑猴子的家:Centos 7.x 安装百度网盘baidunetdisk

黑猴子的家:华为 OpenEuler(欧拉) Linux 之基本配置 - openEuler-20.03-LTS

黑猴子的家:Centos 7.x 安装 PyCharm 2021.3 并创建桌面图标

黑猴子的家:tar xz是啥压缩格式,和tar gz比起来哪个好用??

黑猴子的家:Git 提交空文件夹

黑猴子的家:window7+centos7双系统,卸载centos7系统