rocks集群部署

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了rocks集群部署相关的知识,希望对你有一定的参考价值。

rocks管理节点安装

1、添加管理主节点

①、下载镜像地址ftp://ftp.rocksclusters.org/pub/rocks/rocks-6.2/linux/area51+base+bio+fingerprint+ganglia+hpc+htcondor+java+kernel+kvm+os+perfSONAR+perl+python+sge+web-server+zfs-linux-6.2.x86_64.disk1.iso

②、 使用镜像安装
安装选项输入build然后回车

技术分享

③、选择CD/DVD-based Roll,

技术分享

④、选择要安装的功能,然后点击Submit

技术分享

⑤、点击Next进入下一步

技术分享

⑥、在点击Next进入下一步

技术分享

⑦、配置网卡eth1为外网地址,然后点击Next下一步

技术分享

⑧、配置网卡eth0(私网ip),点击下一步

技术分享

⑨、配置网关为外网网关,DNS为外网DNS,然后点击Next下一步

技术分享

⑩、配置系统root的密码,然后Next下一步

技术分享

⑾、设置时区及NTP时间源地址

技术分享

⑿、划定分区大小,此处选择的自动分配分区大小,然后点击Next下一步

技术分享

⒀、然后就开始自动安装,安装完成后会自动重启

技术分享

⒁、至此,管理主节点安装完成

技术分享


2、配置管理主节点

使用root用户登录,密码为安装过程设置的密码。

技术分享

输入密码后会出现以下提示,直接忽略,进入系统后可以打开终端进行操作。

技术分享

安装计算节点前的准备工作

将计算节点网卡接入私网当中

进入Bios设置,保证网卡的PXE是可用的

配置计算节点的名字等属性

rocks add appliance n membership=”n” node=compute 
rocks set appliance attr n attr=sge value=true
rocks set appliance attr n attr=bio value=true
rocks set appliance attr n attr=managed value=true

以上命令在管理主节点执行

这些命令增加了一个叫做“n”的appliance,并设置了它的属性,支持sge, bio, managed。

在下图中增加了一个叫n的选项。

第一条命令是创建一个新的appliance,在这个appliance下的节点的名字格式为n-x-y, 如n-0-3

后面的几条是为这个appliance添加属性,使得它的节点支持sge, bio等。

可以用命令rocks list appliance来查看所有的appliance。

也可以用命令rocks list appliance attr查看appliance的属性值。


添加计算节点

在管理主节点上以root身份登录,打开终端执行以下命令

# insert-ethers
会让你选择计算节点属性,选择n,然后OK。(n配置是在上面添加的)

技术分享

出现以下界面表示等待计算节点启动安装。

技术分享

打开计算节点电源,进入网络安装

技术分享

技术分享

安装完成后会自动重启加入计算机群。


Rocks的管理维护

1.添加节点

如果要向cluster添加节点,在主节点上使用

# insert-ethers
然后在子节点设定网络启动。实现自动化安装。

2.添加用户

用一般的添加用户的命令进行操作。

# adduser username # passwd username # rocks sync users

特别最后一行命令用来通知子节点添加的用户信息,否则该用户是无法登陆子节点的。

3.删除节点

# rocks remove host compute-0-0 # rocks sync config
删除子节点并更新数据库,必须更新数据库,否则下次添加节点的时候可能会出现问题。

4.强制子节点重启安装

# rocks set host pxeboot compute-0-0 action=install # rocks set host pxeboot compute-0-0 action=os
第一条命令是子节点网络启动重新安装系统,后一个是子节点网络启动直接进入系统。这个可在集群断电
之后子节点重启直接进入grub的情况下使用。

5.显示集群节点列表

# rocks list host


以上是关于rocks集群部署的主要内容,如果未能解决你的问题,请参考以下文章

在 Rocks CentOS 集群上安装 Matlab 时出现 JVM Segfaults

RK3399pro Linux Rock-X AI组件库支持

导致资产预编译在heroku部署上失败的代码片段

rocketmq 双主双从同步写安装部署

Luarocks:如何从特定帐户安装 Rock

单Broker集群,RocketMQ宕机时消费失败会有什么问题