如何在 Kafka Connect S3 中解析记录头?

Posted

技术标签:

【中文标题】如何在 Kafka Connect S3 中解析记录头?【英文标题】:How to parse record headers in Kafka Connect S3? 【发布时间】:2021-01-17 02:55:18 【问题描述】:

我使用 Kafka Connect S3 Sink,它只将记录的值写入 S3。我想将一些记录的标头合并到写入 S3 的最终有效负载中。

我该怎么做?

【问题讨论】:

【参考方案1】:

您将需要使用简单消息转换来截取记录并解包标题并将它们“移动”到记录对象的值部分。

在Kafka Connect S3的源码中可以看到记录值确实只写了。

【讨论】:

感谢您的回答。我的同事在 Kafka Connect 中找到了一个recent commit,看起来配置中会支持它。这是真的吗? 看起来已经合并了,所以看起来是这样。就个人而言,我多年来一直在寻找该功能

以上是关于如何在 Kafka Connect S3 中解析记录头?的主要内容,如果未能解决你的问题,请参考以下文章

Kafka Connect:读取 JSON 序列化的 Kafka 消息,转换为 Parquet 格式并保存在 S3 中

Kafka Connect S3 Sink Flush 数据 - 奇怪的延迟

扩展 Kafka Connect 以处理 10K S3 存储桶

Kafka Connect S3 连接器 OutOfMemory 错误与 TimeBasedPartitioner

Kafka-Connect:启动 S3 Sink 连接器时出现无法识别的错误

gsutil 无法验证 Kafka Connect S3 上传的文件的哈希值