我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?相关的知识,希望对你有一定的参考价值。

我将使用pyspark进行流处理,并使用Kafka作为数据源。

我看到Spark Python API不支持Kafka 0.10连接器。

我是否可以在Spark 2.3.0中使用Kafka 0.8连接器,不管它是否被弃用?

答案

它已弃用,但未删除。你可以使用它。

但是,您可能对结构化流媒体感兴趣,它在Python中支持Kafka 0.10 - 链接here。这是Spark中新的Streaming API,它将取代DStreams

以上是关于我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?的主要内容,如果未能解决你的问题,请参考以下文章

hbase 与 pyspark 的集成

从 Scala Spark 代码调用 Pyspark 脚本

如何使用 pyspark 从 Spark 获取批量行

来自 Spark 安装的 Pyspark VS Pyspark python 包

pyspark 从 spark 数据框列创建一个不同的列表并在 spark sql where 语句中使用

如何删除 Spark 表列中的空格(Pyspark)