如何设置 Slurm 分区 QoS?

Posted

技术标签:

【中文标题】如何设置 Slurm 分区 QoS?【英文标题】:How can I set Slurm Partition QoS? 【发布时间】:2021-12-01 11:55:59 【问题描述】:

我为我的 Slurm 分区创建了分区 QOS,但它不起作用。我怎么解决这个问题。如果有人知道,请告诉我。以下步骤是我的操作。

    创建QoS
$sacctmgr show qos format="Name,MaxWall,MaxTRESPerUser%30,MaxJob,MaxSubmit,Priority,Preempt"
Name       MaxWall                          MaxTRESPU MaxJobs MaxSubmit   Priority    Preempt 
---------- ----------- ------------------------------ ------- --------- ---------- ---------- 
    normal                                                                   0            
batchdisa+                                               0         0         10     

2.将QOS附加到分区

$scontrol show partition
PartitionName=sample01
   AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
   AllocNodes=ALL Default=YES QoS=batchdisable
   DefaultTime=NONE DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
   MaxNodes=UNLIMITED MaxTime=UNLIMITED MinNodes=0 LLN=NO MaxCPUsPerNode=UNLIMITED
   Nodes=computenode0[1-2]
   PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
   OverTimeLimit=NONE PreemptMode=OFF
   State=UP TotalCPUs=2 TotalNodes=2 SelectTypeParameters=NONE
   JobDefaults=(null)
   DefMemPerNode=UNLIMITED MaxMemPerNode=UNLIMITED

3.运行作业

squeue
             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
          67109044    sample01  testjob test  R       1:42      1 computenode01
          67109045    sample01  testjob test  R       1:39      1 computenode02

【问题讨论】:

【参考方案1】:

我能够通过将以下设置添加到 slrum.conf 来解决问题。

AccountingStorageEnforce=associations 

【讨论】:

您的答案可以通过额外的支持信息得到改进。请edit 添加更多详细信息,例如引用或文档,以便其他人可以确认您的答案是正确的。你可以找到更多关于如何写好答案的信息in the help center。

以上是关于如何设置 Slurm 分区 QoS?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 SLURM 获取 GPU (GRES) 分配报告

如何跨 Slurm 集群上的多个节点运行 MPI Python 脚本?错误:警告:无法在 2 个节点上运行 1 个进程,将 nnodes 设置为 1

如何使用 SLURM 停止计算节点?

如何使用 SLURM 提交并行作业步骤?

如何使用 Slurm 在多个节点上发送循环?

如何在节点上平均分配 slurm 任务?