Spark篇---SparkStreaming中算子中OutPutOperator类算子

Posted L先生AI课堂

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark篇---SparkStreaming中算子中OutPutOperator类算子相关的知识,希望对你有一定的参考价值。

一、前述

 

SparkStreaming中的算子分为两类,一类是Transformation类算子,一类是OutPutOperator类算子。

Transformation类算子updateStateByKey,reduceByKeyAndWindow,transform

OutPutOperator类算子print,foreachRDD,saveAsTextFile

本文讲解OutPutOperator类算子。

 

二、具体

     1、foreachRDD

      可以拿到DStream中的一个个的RDD,对拿到的RDD可以使用Transformation类算子对数据进行转换,foreachRDD方法内,拿到的RDD Transformation类算子外的代码是在Driver端执行

 

以上是关于Spark篇---SparkStreaming中算子中OutPutOperator类算子的主要内容,如果未能解决你的问题,请参考以下文章

经典篇 | Spark Streaming 中管理 Kafka Offsets 的几种方式

Apache 流框架 Flink,Spark Streaming,Storm对比分析

Spark Streaming 与 Kafka 集成分析

Apache 流框架 Flink,Spark Streaming,Storm对比分析 - Part2

Spark Streaming + Kafka整合(Kafka broker版本0.8.2.1+)

spark streaming怎么创建文档