黑猴子的家:Spark on hive 与 hive on spark 的区别
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了黑猴子的家:Spark on hive 与 hive on spark 的区别相关的知识,希望对你有一定的参考价值。
参考技术A 是spark 通过Spark-SQL使用hive 语句,操作hive ,底层运行的还是 spark rdd.(1)就是通过sparksql,加载hive的配置文件,获取到hive的元数据信息
(2)spark sql获取到hive的元数据信息之后就可以拿到hive的所有表的数据
(3)接下来就可以通过spark sql来操作hive表中的数据
是把hive查询从mapreduce 的mr (Hadoop计算引擎)操作替换为spark rdd(spark 执行引擎) 操作. 相对于spark on hive,这个要实现起来则麻烦很多, 必须重新编译你的spark和导入jar包,不过目前大部分使用的是spark on hive
黑猴子的家:Centos 7.x 安装 PyCharm 2021.3 并创建桌面图标
参考技术A 友情提示:想安装试一下的朋友,可以先使用2020版本尖叫提示:Python不是必须的,系统自带一个PyCharm也带着
这样以后就可以在桌面双击打开了
以上是关于黑猴子的家:Spark on hive 与 hive on spark 的区别的主要内容,如果未能解决你的问题,请参考以下文章
黑猴子的家:Centos 7.x 安装百度网盘baidunetdisk
黑猴子的家:华为 OpenEuler(欧拉) Linux 之基本配置 - openEuler-20.03-LTS
黑猴子的家:Centos 7.x 安装 PyCharm 2021.3 并创建桌面图标