使用 Kinesis 客户端库 (KCL 2.x) 的多个使用者到 Kinesis Stream

Posted

技术标签:

【中文标题】使用 Kinesis 客户端库 (KCL 2.x) 的多个使用者到 Kinesis Stream【英文标题】:Multiple consumers to the Kinesis Stream using Kinesis Client Library ( KCL 2.x ) 【发布时间】:2020-11-03 13:15:09 【问题描述】:

我有一个应用程序,它使用 KCL 2.x 来使用来自 Kinesis 的记录,存在于不同流分片中的数据具有不同的格式,我想使用具有不同配置的不同 KCL 消费者单独处理它们。例如,如果我在 Kinesis 流中有 3 个分片,我将为不同的分片生成 3 个具有不同配置的不同消费者,即每个分片 1 个消费者。 当我创建多个消费者时,我面临的问题是,如果我通过 java 代码配置 3 个不同的消费者,那么它们中的任何一个都会占用所有分片的租约锁定,而其他消费者无法获得该租约。 例如 总分片:3, 配置的消费者总数:3,

Application logs :

[2020-07-13 18:55:50,549] (LeaseCoordinator-0000) INFO Worker application-test-stream saw 3 total leases, 3 available leases, 1 workers. Target is 3 leases, I have 0 leases, I will take 3 leases (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:397)
[2020-07-13 18:55:50,549] (LeaseCoordinator-0002) INFO Worker application-test-stream saw 3 total leases, 3 available leases, 1 workers. Target is 3 leases, I have 0 leases, I will take 3 leases (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:397)
[2020-07-13 18:55:50,554] (Thread-22) INFO Initialization complete. Starting worker loop. (software.amazon.kinesis.coordinator.Scheduler:238)
[2020-07-13 18:55:50,842] (LeaseCoordinator-0004) INFO Worker application-test-stream saw 3 total leases, 3 available leases, 1 workers. Target is 3 leases, I have 0 leases, I will take 3 leases (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:397)
[2020-07-13 18:55:51,452] (LeaseCoordinator-0000) INFO Worker application-test-stream successfully took 3 leases: shardId-000000000002, shardId-000000000001, shardId-000000000000 (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:203)
[2020-07-13 18:55:51,457] (LeaseCoordinator-0002) INFO Worker application-test-stream failed to take 3 leases: shardId-000000000002, shardId-000000000001, shardId-000000000000 (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:208)
[2020-07-13 18:55:51,757] (LeaseCoordinator-0004) INFO Worker application-test-stream failed to take 3 leases: shardId-000000000002, shardId-000000000001, shardId-000000000000 (software.amazon.kinesis.leases.dynamodb.DynamoDBLeaseTaker:208)

如何配置我的 KCL 消费者,以便消费者只租用分配给他的分片。

【问题讨论】:

【参考方案1】:

通常,Kinesis 消费者是流级别的消费者 - 例如,每个消费者都会消费流中的所有分片。在您的情况下,您可能会根据分片忽略/跳过您不关心的记录处理器中的记录。没有开箱即用的配置选项只能使用特定的分片。

【讨论】:

以上是关于使用 Kinesis 客户端库 (KCL 2.x) 的多个使用者到 Kinesis Stream的主要内容,如果未能解决你的问题,请参考以下文章

每个 kinesis 分片有多个消费者

AWS Kinesis ShardIteratorType TRIM_HORIZON 的预期行为

KCL:声明式的云原生配置策略语言

AWS Kinesis 连接器库

KCL:声明式的云原生配置策略语言

Spark 结构化流 Kinesis 数据源