如何管理LAXCUS计算机集群
Posted LAXCUS分布式操作系统
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何管理LAXCUS计算机集群相关的知识,希望对你有一定的参考价值。
Laxcus计算机集群有大量的节点,分散在各种异构环境中运行,虽然计算机集群的大部分管理业务,已经通过Laxcus分布式操作系统内置的DFL3人工智能模型实施,但是仍然有小部分工作需要人工干预。在Laxcus分布式操作系统6.0之前的版本中,管理员为用户分配计算存储资源,检查集群和节点的运行状态,需要使用命令行远程检索和操控这些节点。因为字符界面和命令行本身的局限性,管理计算机集群缺少直观的体验感受。升级6.0版本后,管理计算机集群有专门的Watch节点来实施这项工作,这是一个图形化的桌面环境,类似于Windows桌面,同时在Watch节点桌面上,计算机集群的管理交互和功能展示工作,则由“我的集群”来负责。
“我的集群”是基于Laxcus分布式标准开发的应用软件,被集成在Watch节点。打开这个软件后,首先出现的是一个启动封面,然后计算机集群中的所有节点,都会显示在这个软件的图形界面上。
“我的集群”启动封面
“我的集群”左侧分别是“集群节点”和“集群用户”。在Laxcus是一个多域计算机集群,包括有BANK集群、HOME集群、TOP集群。在Laxcus分布式操作系统的体系中,BANK集群被定义为管理计算机集群的用户资源,有ENTRANCE、GAET、HASH、ACCOUNT四类节点。HOME集群被定义为负责具体的工作业务,各种大规模、超大规模的分布式存储和分布式计算工作,以及分布式应用软件的运行,都在HOME集群中处理,有CALL、DATA、WORK、BUILD四类节点。TOP集群则是负责总体的业务规则分配和调度工作,有BANK、HOME、LOG三类节点。Watch节点启动时,可以登录到BANK、HOME、TOP任何一类节点。登录成功后,打开“我的集群”这个软件,相关节点以及节点的各种信息,就在显示在软件界面上。
集群用户一栏显示的是用户信息,分为“注册用户”和“在线用户”两种。注册用户表示系统已经通过“CREATE USER”命令,被系统接受登记和获得某些授权。在线用户则是用户在获得授权情况下,登录进入Laxcus计算机集群,处于激活工作状态。
与Laxcus计算机集群交互,目前主要通过“我的集群”的检索栏来执行,这类似Windows 11的“搜索”功能,需要输入关键字或者命令,然后交给“我的集群”后端来处理执行。比如管理员需要检索当前BANK集群有多少GATE节点,以及GATE节点的地址情况时,可以输入关键字“GATE SITES”,系统会把相关的“GATE”节点突出显示出来。或者管理员需要查阅某个用户信息和节点分布情况,可以通过关键字“USER 用户名称”来实现,这时这个用户的集群节点的物理分布以及其它信息,会一并显示在下方。
检索栏同时支持Laxcus分布式命令。Laxcus分布式操作系统有大量的分布式命令,查阅它们可以输入“HELP 命令关键字”来检索。比如输入“HELP SET*”后,会在桌面弹出帮助窗口,上面将显示与“SET”关键字相关的所有命令。
“我的集群”运行过程中,后台会定时检索每个节点的运行状态。这些信息通过右侧的“运行节点”显示出来,包括每个节点的CPU、内存、磁盘使用占比,在线人数、分布式应用软件运行规模等。使用“SET OUTLOOK INTERVAL”命令,可以改变检索间隔时间。比如输入“SET OUTLOOK INTERVAL 30秒”,表示间隔30秒会刷新新一次所有节点记录。最小的检索间隔时间,我的集群规定是10秒钟。
另外“我的集群”还有一个支持高亮显示的命令窗口,它和功能和检索栏类似,区别是字体可以调节点,可用空间更大,为集群管理员多提供一个管理集群的输入接口。
“我的集群”除了向集群节点发起检索请求,集群上的每个节点也会主动向“我的集群”投递运行信息。这些运行信息主要是一些警告和故障,比如发生CPU超载,内存、硬盘空间不足,在线人数达到最大运行规模、分布式应用软件运行过程中出现故障时,这些节点就会主动将信息投递给“我的集群”,在图形界面上,以文字、图像、声音的方式显示出来,提示管理员注意,让管理员调整修改运行规则,动态增加计算机节点等工作。
在支持第三方扩展应用上,“我的集群”也同样做到了。但是需要开发者熟悉Invoke/Produce模型,根据Laxcus分布式操作系统分布式编程规则,通过DAPI接口编写分布式应用插件来实现。
Laxcus分布式操作系统把大量的分布式处理工作都隐藏在命令中,目前已经有三百多个命令,各位有兴趣可以去尝试一下。它们与Windows、Linux只在本地执行的单机命令完全不同,Laxcus分布式命令会同时分散到很多计算机节点上并行执行,处理能力和处理效率不在一个数量级。
了解更多Laxcus分布式操作系统的图形设计、网络通信、分布式存储、大数据、分布式计算、边缘计算、人工智能、云原生、安全管理、分布式应用软件开发和其它前沿技术,请关注公众号“Laxcus分布式操作系统”,或者微信Laxcus加入产品技术群,让我们一起讨论最新的技术知识。
以上是关于如何管理LAXCUS计算机集群的主要内容,如果未能解决你的问题,请参考以下文章