sparkSQL flinkSQL hiveSQL性能对比
Posted 狂奔的骆驼
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sparkSQL flinkSQL hiveSQL性能对比相关的知识,希望对你有一定的参考价值。
最近在研究flink,发现较新版的flink支持sql,这下好了,我用spark两年了,对用法和性能算是踩过一些坑了。
听说flink挺快的,那么flinkSQL和sparkSQL到底哪个快呢?
想必很多人也想知道吧,那就拿数据说话(虽然不是自己做的基线测试,但好歹也找了好久)
下图是hive, spark, flink的sql执行速度对比:
下图是平均的
综上所述,flinkSQL和sparkSQL的性能只差一点点,flink是spark的最强大的竞争者。
个人认为flink潜力很大。
第一,flink主要是java写的代码,相比scala写的spark而言,flink的内存溢出问题更容易定位和优化。
第二,flink是在idea环境开发的,而我主要就是用这个开发环境,非常方便。
本人用sparkSQL两年来,数据倾斜,内存溢出问题见过太多,相当坑爹,而官方源码几乎很难打包编译调试。
第三、flink更专业,spark就是综合rdd,sql,图计算,流式计算的等几个模块综合体,长远来看不利于开源社区演进
以上是关于sparkSQL flinkSQL hiveSQL性能对比的主要内容,如果未能解决你的问题,请参考以下文章
flink sql 知其所以然(十三):流 join问题解决
95-910-140-源码-FlinkSQL-FlinkSQL简介
95-910-335-源码-FlinkSQL-Calcite-FlinkSQL解析
95-910-142-源码-FlinkSQL-FlinkSQL追加模式与缩进模式区别
flinksql的 / 的结果只会保留整数部分,flinksql 不支持 div运算符。hive mysql : / 结果是小数, div 结果只会保留整数部分