Debezium MongoDB 连接器错误:org.apache.kafka.connect.errors.ConnectException:错误处理程序中超出公差

Posted

技术标签:

【中文标题】Debezium MongoDB 连接器错误:org.apache.kafka.connect.errors.ConnectException:错误处理程序中超出公差【英文标题】:Debezium MongoDB Connector Error: org.apache.kafka.connect.errors.ConnectException: Tolerance exceeded in error handler 【发布时间】:2020-08-13 12:49:41 【问题描述】:

我正在尝试为带有转换的 MongoDB 部署新的 Debezium 连接器。配置如下:

"name": "mongo_source_connector_autostate",
    "config": 
    "connector.class": "io.debezium.connector.mongodb.MongoDbConnector", 
    "tasks.max":1,
    "initial.sync.max.threads":4,
    "mongodb.hosts": "rs0/FE0VMC1980:27017", 
    "mongodb.name": "mongo", 
    "collection.whitelist": "DASMongoDB.*_AutoState",
    "transforms": "unwrap",
    "transforms.unwrap.type" : "io.debezium.connector.mongodb.transforms.UnwrapFromMongoDbEnvelope",
    "transforms.sanitize.field.names" : true
    

但是连接器失败并出现以下错误:

 org.apache.kafka.connect.errors.ConnectException: Tolerance exceeded in error handler
        at org.apache.kafka.connect.runtime.errors.RetryWithToleranceOperator.execAndHandleError(RetryWithToleranceOperator.java:178)
        at org.apache.kafka.connect.runtime.errors.RetryWithToleranceOperator.execute(RetryWithToleranceOperator.java:104)
        at org.apache.kafka.connect.runtime.WorkerSourceTask.convertTransformedRecord(WorkerSourceTask.java:290)
        at org.apache.kafka.connect.runtime.WorkerSourceTask.sendRecords(WorkerSourceTask.java:316)
        at org.apache.kafka.connect.runtime.WorkerSourceTask.execute(WorkerSourceTask.java:240)
        at org.apache.kafka.connect.runtime.WorkerTask.doRun(WorkerTask.java:177)
        at org.apache.kafka.connect.runtime.WorkerTask.run(WorkerTask.java:227)
        at java.util.concurrent.Executors$RunnableAdapter.call(Unknown Source)
        at java.util.concurrent.FutureTask.run(Unknown Source)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(Unknown Source)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(Unknown Source)
        at java.lang.Thread.run(Unknown Source)
Caused by: org.apache.avro.SchemaParseException: Illegal initial character: 10019_AutoState
        at org.apache.avro.Schema.validateName(Schema.java:1528)
        at org.apache.avro.Schema.access$400(Schema.java:87)
        at org.apache.avro.Schema$Name.<init>(Schema.java:675)
        at org.apache.avro.Schema.createRecord(Schema.java:212)
        at io.confluent.connect.avro.AvroData.fromConnectSchema(AvroData.java:893)
        at io.confluent.connect.avro.AvroData.fromConnectSchema(AvroData.java:732)
        at io.confluent.connect.avro.AvroData.fromConnectSchema(AvroData.java:726)
        at io.confluent.connect.avro.AvroData.fromConnectData(AvroData.java:365)
        at io.confluent.connect.avro.AvroConverter.fromConnectData(AvroConverter.java:80)
        at org.apache.kafka.connect.storage.Converter.fromConnectData(Converter.java:62)
        at org.apache.kafka.connect.runtime.WorkerSourceTask.lambda$convertTransformedRecord$2(WorkerSourceTask.java:290)
        at org.apache.kafka.connect.runtime.errors.RetryWithToleranceOperator.execAndRetry(RetryWithToleranceOperator.java:128)
        at org.apache.kafka.connect.runtime.errors.RetryWithToleranceOperator.execAndHandleError(RetryWithToleranceOperator.java:162)
        ... 11 more

我已使用以下配置以分布式模式启动连接器:

...
key.converter=io.confluent.connect.avro.AvroConverter
key.converter.schema.registry.url=http://localhost:8081
value.converter=io.confluent.connect.avro.AvroConverter
value.converter.schema.registry.url=http://localhost:8081

internal.key.converter=org.apache.kafka.connect.json.JsonConverter
internal.value.converter=org.apache.kafka.connect.json.JsonConverter
internal.key.converter.schemas.enable=false
internal.value.converter.schemas.enable=false
...

注意:我有另一个没有任何转换的连接器。它运行得很好。

我想就此获得一些帮助。提前致谢。

【问题讨论】:

【参考方案1】:

您的某个字段似乎违反了 Avro 命名规则。在你的情况下,它似乎是这个:

全名的名称部分、记录字段名称和枚举符号 必须:

[A-Za-z_]开头

但是10019_AutoState 违反了规则,因为它以数值开头。你可以把它改成AutoState10019


您可以查看包含所有记录字段命名约束here 的完整列表。

【讨论】:

没错!不幸的是,我的收藏名称以数字开头,我们无法更改。 @NilabhraPatra 不幸的是,我认为没有解决方法。 感谢您的帮助。谢谢你:) 有一种解决方法,但需要使用 Java 代码。您可以引入一个单一消息转换,它将在模式进入转换器之前重命名,【参考方案2】:

什么 Debezium 版本?如果是 1.1/1.2 的问题,请提出 Jira 问题。架构名称需要清理,在我看来,在这种情况下,错误来自集合名称10019_AutoState,而架构名称未清理,因为它不能以数字开头。

【讨论】:

我使用的是 1.1 版。 那么您能否将其报告为 ebezium 中的错误?谢谢 我为此创建了 DBZ-2046。

以上是关于Debezium MongoDB 连接器错误:org.apache.kafka.connect.errors.ConnectException:错误处理程序中超出公差的主要内容,如果未能解决你的问题,请参考以下文章

Debezium Kafka 连接器 mongodb:将 kafka 连接器连接到 mongodb 时出错

Debezium Kafka 连接器 mongodb

kafka connect debezium mongodb连接器无法加载

将 cdc 限制为特定集合的 Debezium mongodb 连接器属性

在远程 MSK kafka 集群上使用 kafka 连接 mongoDB debezium 源连接器

我们如何从带有 debezium kafka 连接器的副本集中的辅助 mongodb 节点跟踪 oplog?