来自工作人员的错误消息:generic::aborted: SDK 线束 sdk-0-1 已断开连接
Posted
技术标签:
【中文标题】来自工作人员的错误消息:generic::aborted: SDK 线束 sdk-0-1 已断开连接【英文标题】:Error message from worker: generic::aborted: SDK harness sdk-0-1 disconnected 【发布时间】:2021-04-16 08:50:45 【问题描述】:我在处理一项 Dataflow 作业时遇到了一些问题。我不时收到此错误消息。似乎在这个错误之后,作业一直运行良好,但是,今天晚上它实际上卡住了,或者它开始慢慢处理元素。 您还可以从屏幕截图中看到,工人开始表现得非常奇怪,如下面屏幕截图中的 CPU 使用率图表所示。
Error message from worker:
generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
passed through: ==> dist_proc/dax/workflow/worker/fnapi_service.cc:631 generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
passed through: ==> dist_proc/dax/workflow/worker/fnapi_service.cc:631 generic::aborted: SDK harness sdk-0-1 disconnected.
passed through: ==> dist_proc/dax/workflow/worker/fnapi_service.cc:631 generic::aborted: SDK harness sdk-0-1 disconnected.
passed through: ==> dist_proc/dax/workflow/worker/fnapi_service.cc:631 generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
passed through: ==> dist_proc/dax/workflow/worker/fnapi_service.cc:631 generic::aborted: SDK harness sdk-0-1 disconnected.
generic::aborted: SDK harness sdk-0-1 disconnected.
【问题讨论】:
【参考方案1】:该错误消息可能是由多种原因引起的,因此除非错误消息伴随用户描述的其他行为,否则这可能是由于任意数量的errors。
在我的情况下,这是由于 IO 错误:磁盘上没有剩余空间
进一步调查的好方法是查看
Diagnostics:表格显示了在所选时间线上发生错误的位置以及对您的管道的可能建议。【讨论】:
我如何检查这个?工人监控似乎很好,日志显示与磁盘空间或类似的东西无关。 @TudorPlugaru 您是否也检查过您的工作日志?我在答案所附的屏幕截图中突出显示了您的诊断部分。 是的,我查过了,里面什么都没有,这里有两张截图ibb.co/sbQf4f6ibb.co/j5Fftdj 您能否确认您的作业的 CPU 是高于还是低于 80%? 从我的观察来看,这些错误是在autoscaling的时候出现的,CPU低于80%以上是关于来自工作人员的错误消息:generic::aborted: SDK 线束 sdk-0-1 已断开连接的主要内容,如果未能解决你的问题,请参考以下文章
流程维度失败并显示消息“发生来自 WriteFile 的 FileStore 错误”?
如何在 SwiftUI URLSession 中显示来自服务器的错误消息