2020/2/13寒假自学——学习进度报告16

Posted limitcm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2020/2/13寒假自学——学习进度报告16相关的知识,希望对你有一定的参考价值。

  电脑修好了,但之前落下的几天博客确实没啥补的劲头,今天先写一份报告吧。


  

实验内容和要求

安装 Flume

 技术图片

安装成功。

使用 Avro 数据源测试 Flume

配置文件

技术图片

技术图片

 

 

启动flume agent a1

技术图片

创建指定的日志文件

技术图片

客户端传输

技术图片

传输完成

 使用 netcat 数据源测试 Flume

创建example.conf

技术图片

启动flume

技术图片

启动Telnet

技术图片

 技术图片

Hellowworld

技术图片

 

 

使用 Flume 作为 Spark Streaming 数据源

配置文件技术图片

拷贝依赖包技术图片

修改spark-env.sh添加环境变量技术图片

编写python程序

import sys



from pyspark import SparkContext

from pyspark.streaming import StreamingContext

from pyspark.streaming.flume import FlumeUtils

import pyspark



if __name__ == "__main__":

    if len(sys.argv) != 3:

        print("Usage: flume_wordcount.py <hostname> <port>", file=sys.stderr)

        exit(-1)



    sc = SparkContext(appName="FlumeEventCount")

    ssc = StreamingContext(sc, 2)



    hostname = sys.argv[1]

    port = int(sys.argv[2])

    stream = FlumeUtils.createStream(ssc, hostname, port, pyspark.StorageLevel.MEMORY_AND_DISK_SER_2)

    stream.count().map(lambda cnt: "Recieve " + str(cnt) + " Flume events!!!!").pprint()



    ssc.start()

    ssc.awaitTermination()

启动spark

技术图片

运行python

 技术图片

运行flume技术图片

启动Telnet

技术图片

接收成功

技术图片

以上是关于2020/2/13寒假自学——学习进度报告16的主要内容,如果未能解决你的问题,请参考以下文章

2020/1/27寒假自学——学习进度报告7

2020/2/1寒假自学——学习进度报告8

2020/1/25寒假自学——学习进度报告6

2020/1/24寒假自学——学习进度报告5

2020/1/18寒假自学——学习进度报告3

2020/1/18寒假自学——学习进度报告4