SPARK 入门笔记
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SPARK 入门笔记相关的知识,希望对你有一定的参考价值。
1、Spark基于内存进行运算
2、Spark核心是SprintContext,是程序的入口
3、RDDs是提供抽象的数据集,通过RDDS可以方便对分布在各个节点的数据进行计算,而且忽略细节
4、RDDs与Stream API
5、RDDs采用类似延时加载,计算功能
6、RDDs的combineByKey函数是一个较核心的函数:如下
def combineByKey[C]( createCombiner: V => C, mergeValue: (C, V) => C, mergeCombiners: (C, C) => C, partitioner: Partitioner, mapSideCombine: Boolean = true, serializer: Serializer = null)
以上是关于SPARK 入门笔记的主要内容,如果未能解决你的问题,请参考以下文章
[学习笔记]黑马程序员Spark全套视频教程,4天spark3.2快速入门到精通,基于Python语言的spark教程