我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?相关的知识,希望对你有一定的参考价值。
我将使用pyspark进行流处理,并使用Kafka作为数据源。
我看到Spark Python API不支持Kafka 0.10连接器。
我是否可以在Spark 2.3.0中使用Kafka 0.8连接器,不管它是否被弃用?
答案
它已弃用,但未删除。你可以使用它。
但是,您可能对结构化流媒体感兴趣,它在Python中支持Kafka 0.10 - 链接here。这是Spark中新的Streaming API,它将取代DStreams
以上是关于我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?的主要内容,如果未能解决你的问题,请参考以下文章
来自 Spark 安装的 Pyspark VS Pyspark python 包