flink的流式wordcount代码解析

Posted hdc520

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了flink的流式wordcount代码解析相关的知识,希望对你有一定的参考价值。

(1)代码示例

 1 import org.apache.flink.streaming.api.scala._
 2 
 3 object StreamWordCount {
 4   def main(args:Array[String]):Unit={
 5     //创建流处理的执行环境
 6     val env=StreamExecutionEnvironment.getExecutionEnvironment;
 7 
 8     //接受一个socket文本流即创建数据源
 9     val dataStream=env.socketTextStream("localhost",7777);
10 
11     //对每条数据进行处理
12     val wordCountDataStream=dataStream.flatMap(_.split(" "))
13       .filter(_.nonEmpty)
14       .map(line=>(line,1))
15       .keyBy(line=>line._1)
16       .sum(1);
17    //输出结果,可以直接输出也可以将处理的结果存储到外部系统中如kafka
18     wordCountDataStream.print();
19     //flink的操作是惰性的,需要启动executor。
20     env.execute("stream WC job")
21   }
22 }

 

以上是关于flink的流式wordcount代码解析的主要内容,如果未能解决你的问题,请参考以下文章

大数据——Flink 入门程序(wordcount)

Flink官方例子解析:WordCount

Flink 1.14 Table & SQL 第一个程序 WordCount

Flink 1.14 Table & SQL 第一个程序 WordCount

04-flink-1.10.1-流处理WordCount代码里控制并行度

04-flink-1.10.1-流处理WordCount代码里控制并行度