spark

Posted 人生,唯有锻炼与读书不能辜负

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark相关的知识,希望对你有一定的参考价值。

一、 spark 2  版本 相对于以前版本的变化

    spark core  :

                  Accumulators (累加器):性能更好,页面上也可以看到累加器的信息

     spark sql: 

             1、

             2、DataSet(合并了之前的dataFrame)

                  spark 2 里面没有dataframe了,dataframe只是dataset的一部分

            3、对sql语句的支持更好

                在spark 1.x的时候是不支持子查询。但是spark2 的时候可以了

            

二、spark 为什么由 1  升级到 2

以上是关于spark的主要内容,如果未能解决你的问题,请参考以下文章

SparkSpark Streaming

SparkSpark ShuffleSpark SQL 及 Spark MLlib

SparkSpark之Transformation和Action

SparkSpark的Shuffle机制

sparkspark sql

SparkSpark一些面试题