SLURM 中的“CG”状态是啥意思?

Posted

技术标签:

【中文标题】SLURM 中的“CG”状态是啥意思?【英文标题】:What does the status "CG" mean in SLURM?SLURM 中的“CG”状态是什么意思? 【发布时间】:2017-06-21 07:40:41 【问题描述】:

在 SLURM 集群上,可以使用 squeue 获取有关系统上作业的信息。

我知道“R”的意思是running;而“PD”的意思是pending,但什么是“CG”?

我理解它是“取消”或“失败”的经验,但是当工作成功c失败时,“CG”是否适用? G是什么?

【问题讨论】:

【参考方案1】:

“CG”代表“completing”,它发生在一个无法终止的作业上,可能是因为 I/O 操作。

更多详细信息在Slurm Troubleshooting Guide

【讨论】:

【参考方案2】:

我在 Slurm 故障排除指南的 'squeue' section 中找到了这个:

状态

作业状态,扩展形式:PENDING, RUNNING, STOPPED, SUSPENDED, 取消、完成、完成、配置、失败、超时、 PREEMPTED、NODE_FAIL、REVOKED 和 SPECIAL_EXIT。查看工作状态 下面的代码部分了解更多信息。 (仅适用于职位)

状态压缩

作业状态,紧凑形式:PD(待处理),R(运行),CA(已取消), CF(配置)、CG(完成)、CD(完成)、F(失败)、TO (超时)、NF(节点故障)、RV(撤销)和 SE(特殊退出) 状态)。有关详细信息,请参阅下面的工作状态代码部分。 (仅适用于职位)

【讨论】:

以上是关于SLURM 中的“CG”状态是啥意思?的主要内容,如果未能解决你的问题,请参考以下文章

pykalman 标准 filtercorrect 模块中的“观察偏移”和“预测状态均值”是啥意思?

Google Play 商店中的“已被您删除”应用状态是啥意思 [关闭]

Chrome DevTools - 时间选项卡中的“排队”是啥意思?

SVN 中的结果代码是啥意思?

网络中的ospf 是啥意思?

网络中的ospf 是啥意思?