有哪些开源解决方案可以使用 Kafka Connect 将数据从 Kafka 移动到 HDFS3?

Posted

技术标签:

【中文标题】有哪些开源解决方案可以使用 Kafka Connect 将数据从 Kafka 移动到 HDFS3?【英文标题】:What open source solutions exist to move data from Kafka to HDFS3 using Kafka Connect? 【发布时间】:2021-07-27 15:25:42 【问题描述】:

除了 Confluent HDFS 库(非开源)之外,是否有任何完全开源的库可以将消息从 Kafka(使用 Kafka Connect)移动到 HDFS 3?

Kafka Connect HDFS 2 Sink - Confluent 社区许可证 Kafka Connect HDFS 3 Sink - Confluent 企业许可证

相关:Need to move small JSON messages from Kafka to HDFS with Kakfa Connect but without using Confluent libs, if not completely free

【问题讨论】:

请求外部库被认为是题外话 - help center. 【参考方案1】:

HDFS2 连接器开源的,如果您不使用它作为托管服务提供它,或者如我之前所说,Apache Nifi 是一个更丰富的工作流产品,与 Kafka 一起在 Hadoop 生态系统中运行良好。 Spark 或 Flink 也经常用于此目的

【讨论】:

HDFS2 连接器可以写在 HDFS 3 上吗? 我不明白为什么它不能。虽然我没有亲自尝试过 来自网站:Kafka Connect HDFS 2 Sink 连接器允许您将数据从 Kafka 主题导出到各种格式的 HDFS 2.x 文件,并与 Hive 集成以使数据立即可用于查询HiveQL。 这并没有明确表示它不起作用。例如,Spark 2 仍然使用 HDFS 2.x 客户端库,它仍然可以与 HDFS 3.x 服务器一起使用

以上是关于有哪些开源解决方案可以使用 Kafka Connect 将数据从 Kafka 移动到 HDFS3?的主要内容,如果未能解决你的问题,请参考以下文章

Kafka 与 Apache Pulsar 相比都有哪些优缺点 [关闭]

大数据平台是什么?有哪些功能?如何搭建大数据平台?

分布式消息服务DMS与开源Kafka对比

分布式消息服务DMS与开源Kafka对比

Confluent Kafka Connect MySQL Sink Connector 的开源替代方案?

接口自动化测试实践指导(上):接口自动化需要做哪些准备工作