LSF批量bkill任务

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LSF批量bkill任务相关的知识,希望对你有一定的参考价值。

参考技术A LSF:Load Sharing Facility

例:bkill所有PSUSP状态的任务

单个用户
(bkill -u username 0,删除该用户下所有提交的并行任务)

bjobs -u username | grep PSUSP|awk 'print $1' |xargs bkill

所有用户
bjobs -u all -p -q normal | grep PSUSP|awk 'print $1' |xargs bkill
(-p参数,可有可无,不影响命令执行结果)

PS:常用LSF命令(更详细命令使用可参考LSF的PDF手册)
bjobs 检查提交作业状态
bjobs –r 显示正在运行的作业
bjobs –a 显示正在运行的和最近完成的作业
bjobs -p 显示等待运行的作业和等待原因
bjobs –s 显示正在挂起的作业和挂起的原因
bjobs -l 显示该作业的所有信息

bhist 显示最近完成作业或正在运行作业的历史情况
bhist <jobid>

bkill 删除不需要的作业
bkill <jobid>
bkill –r <jobid>

bpeek 当作业正在运行时显示它的标准输出,监视作业运行
bpeek <jobid>

bqueues 显示队列信息
bqueues
bqueues –l <queue name>

bhosts 显示各节点作业相关情况
bhosts
bhosts <hostname>

LSF Community Edition(LSF社区版)介绍与下载

 

请见链接

LSF社区版介绍与下载

 

如有疑问,欢迎私信。

以上是关于LSF批量bkill任务的主要内容,如果未能解决你的问题,请参考以下文章

LSF - bsub提交的任务关掉了,bjob查看job还在RUN?

LSF - LSF会使用什么cgroup子系统?

Linux - 因执行机光模块故障导致LSF job的idle_factor为0

NFS - LSF执行机跑VCS时报错No locks available

使用集群运行你的python代码

IBM Spectrum LSF-访问不同HPC节点上的多个GPU