SPARK 入门笔记

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SPARK 入门笔记相关的知识,希望对你有一定的参考价值。

1、Spark基于内存进行运算

2、Spark核心是SprintContext,是程序的入口

3、RDDs是提供抽象的数据集,通过RDDS可以方便对分布在各个节点的数据进行计算,而且忽略细节

4、RDDs与Stream API

5、RDDs采用类似延时加载,计算功能

6、RDDs的combineByKey函数是一个较核心的函数:如下

def combineByKey[C](  
      createCombiner: V => C,  
      mergeValue: (C, V) => C,  
      mergeCombiners: (C, C) => C,  
      partitioner: Partitioner,  
      mapSideCombine: Boolean = true,  
      serializer: Serializer = null)  

 

以上是关于SPARK 入门笔记的主要内容,如果未能解决你的问题,请参考以下文章

spark SQL入门指南《读书笔记》

spark SQL入门指南《读书笔记》

Spark 从入门到精通学习笔记大纲

[学习笔记]黑马程序员Spark全套视频教程,4天spark3.2快速入门到精通,基于Python语言的spark教程

spark学习笔记——sparkStreaming-概述/特点/构架/DStream入门程序wordcount

在这个 spark 代码片段中 ordering.by 是啥意思?