Slurm任务调度系统部署和测试

Posted liwanliangblog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Slurm任务调度系统部署和测试相关的知识,希望对你有一定的参考价值。

1. 概述

slurm任务调度系统,主要应用在HPC集群资源管理和任务调度。具体信息参见slurm官方网站:https://slurm.schedmd.com/
部署Slurm任务调度系统,需要部署NTP内网时间同步服务器,LDAP全局认证服务器,mysql数据库服务器
本篇博客主要记录如何部署和使用slurm任务调度系统。

1.1 节点信息

节点主机名操作系统主机地址主机角色
node11centos6.5_x86_64192.168.10.11主控制器
node12centos6.5_x86_64192.168.10.12备控制器
node13centos6.5_x86_64192.168.10.13数据存储主控制器
node14centos6.5_x86_64192.168.10.14数据存储备控制器
node15centos6.5_x86_64192.168.10.15MySQL数据库服务器

2. 节点准备

本篇博客的节点,均有已经部署好NTP和LDAP服务客户端的node11克隆,减少部署过程的繁琐。
KVM克隆虚拟机,参见博客《KVM虚拟机管理——虚拟机克隆.md
博客园地址:https://www.cnblogs.com/liwanliangblog/p/9193910.html
根据博客内容指导,很容易克隆出其他几台虚拟机,提供slurm任务调度环境部署和测试。

3. 部署NTP服务器

笔记内链:《NTP服务部署和测试.md
博客园地址:https://www.cnblogs.com/liwanliangblog/p/9194004.html
NTP时间服务器部署完成之后,需要同步各个节点的时间。

注:对于节点的NTP同步,可以采用pdsh并行工具完成
pdsh并行工具安装和使用,参见笔记内链:《并行管理工具——pdsh.md
博客园地址:https://www.cnblogs.com/liwanliangblog/p/9194146.html

4. 部署LDAP服务器

笔记内链:《LDAP-openldap服务部署和测试(YUM安装).md
博客园地址:https://www.cnblogs.com/liwanliangblog/p/9193916.html

5. 部署Munge认证服务

笔记内链:《MUNGE服务部署和测试.md
博客园地址:https://www.cnblogs.com/liwanliangblog/p/9194032.html

6. 部署Mysql数据库服务

本篇博客在node15上安装MySQL数据库
笔记内链:《MySQL数据库安装和参数配置(YUM).md》
博客园:

6. 部署slurm

6.1 slurm下载

从slurm的官网下载地址:https://www.schedmd.com/downloads.php;即可下载最新版的slurm,本篇博客主要部署两个版本

  • slurm-16.05.3.tar.gz 该版本已经被官网废弃,本篇博客因为工作需要继续使用
  • slurm-17.11.7.tar.bz2 截至博客更新时的最新版本

6.2 解压编译安装























以上是关于Slurm任务调度系统部署和测试的主要内容,如果未能解决你的问题,请参考以下文章

slurm-16.05.3任务调度系统部署与测试

点我达分布式任务调度系统-DaJob

SLURM 资源管理系统

任务调度思考与开源软件opencron的使用经验

大数据Hadoop之——任务调度器Oozie(Oozie环境部署)

Slurm及OpenLDAP部署