50华为HCIE-Storage--存储维护与故障处理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了50华为HCIE-Storage--存储维护与故障处理相关的知识,希望对你有一定的参考价值。

-----------------------------------重要说明------------------------------------

以下部分内容来网络,部分自华为存储官方教材

具体教材内容请移步华为存储官网进行教材下载

    网络引用内容无法找到原创,如有侵权请通知

     ------------------------------------重要说明------------------------------------

技术分享图片

1.Toolkit

① store

技术分享图片

技术分享图片

在第一次安装OceanStor Toolkit工具箱后, 您需要输入用户名和密码进行身份验证(用户名和密码是华为企业业务技术支持网站上的账号), 以此来激活工具Store。 并且您可以通过工具Store将已安装的工具导出到本地, 也可以将本地下载好的工具导入到工具Store中。

1. 功能导航栏:通过此导航栏可以选择功能类别。

2. 工具筛选条件: “ 待升级” , “ 未安装” , “ 最新” 。

3. 单击“ 刷新” , 会根据筛选条件获取指定的工具列表。

4. 对于未安装的工具, 可以单击“ 安装” 安装该工具。

5. 单击“ 详情” , 查看此工具的详情。

6. 单击“ 反馈” , 反馈信息。

7. 对于已安装的工具, 可以单击“ 卸载” 卸载此工具。

8. 对于已安装的工具, 如果技术支持网站上有对应的新版本, 则可以单击“ 升级” 升级该工具。

9. 单击“ 导出工具” , 将工具Store中已安装的工具导出到本地。

10.单击“ 导入工具” , 可以将从Toolkit工具箱导出到本地的工具包或从技术支持网站下载到本地的工具包导入到Toolkit工具箱中。 说明如果 该工具有对应的业务包, 请通过相同的方式导入业务包。

11. 单击“ 重新激活” , 可以对用户变化后的身份进行重新验证, 并重新激活工具Store。

 

② 巡检

技术分享图片 


技术分享图片

技术分享图片

③ 信息收集

技术分享图片


2.常见问题

① 误码

误码数是设备上记录的各个端口所接收到的误码总和。

产生原因很多一般分为部件故障非部件故障

部件故障:一般是由于链路上部件异常或链路上各部件间接接触异常导致。

非部件故障:一般为线缆触碰、线缆插拔、接口虚接。

技术分享图片

② 内存使用率过高

此巡检项是巡检系统是否有内存使用率过高的记录;

此项不通过并不表示系统处于故障状态,一般在业务压力过大的情况下,内存使用率会过高;

处理方法:

可以在业务量较小时间段再进行一次巡检;

若持续出现内存使用率过高的情况,为避免出现其他系统异常导致的内存消耗,请收集阵列日志并返回华为;

③ 告警检查不通过

告警检查包括了紧急、重要、警告三种级别的告警。产生了告警说明设备发生了某种异常需要处理;

处理方法:

登陆设备查看具体的告警信息,根据告警信息的提示进行修复;

收集阵列日志,并返回华为处理;

④ 软件状态不通过

软件主要是设备上运行的软件,检查项会对版本号等必要的的合法性进行检测,有该类型检查项检查不通过说明软件出现了问题需要更新或者修复

处理方法:

收集阵列日志,并返回华为确认处理。

⑤ 升级流程

技术分享图片

技术分享图片

l 在线升级:升级前需要确保升级包版本支持从当前版本在线升级到升级包版本。 进行

在线升级时, 系统会依次对控制器软件进行升级, 首先升级备用控制器( 备控) 软件

, 再升级主控制器( 主控) 软件。 升级备用控制器时, 首先将备控的业务切换到主控

, 然后自动检查需要升级的固件并依次进行升级, 升级完成后重新启动备控系统, 备

控系统重新恢复上电后, 归属于备控的业务切换回备控, 并将原主控的业务切换到备

控。 然后按照相同的方式进行主控软件的升级。

l 离线升级:离线升级过程中, 主控和备控同时进行升级, 大大缩短了升级时间。 由于

升级之前已经中止主机业务读写, 这样就降低了系统在升级过程中出现数据丢失、 业

务中断的风险。

技术分享图片 

 

l 在OceanStor Toolkit主界面, 单击“ 升级” , 选择“ 设备升级” , 进入“ 设备升级” 界

面。

l 在“ 设备升级” 界面, 单击“ 添加设备” 。

l 在“ 选择升级设备” 界面, 单击“ 添加设备” 。

技术分享图片 

 

l 升级包路径和数据备份路径选择完成后, 在“ 升级信息设置” 界面, 选择升级模式。

l 升级模式选择完成后, 选择是否启用专家模式。

l 单击“ 完成” 按钮, 进入“ 设备升级” 界面。

 

技术分享图片
 

 

 

l 在“ 设备升级” 界面, 选择要升级的阵列, 再单击“ 执行升级” 按钮开始升级。

l 系统弹出“ 升级确认” 对话框, 确认完成后, 选中复选框并单击“ 确定” 按钮进行升

级。

l 系统自动进入设备升级的导入升级包步骤。

l 导入包完成之后, 系统自动进入升级前检查步骤。

l 在升级前检查完成之后, 系统自动进入数据备份步骤。

l 在执行升级完成之后, 系统自动进入升级后验证步骤。

l 查看升级后版本与升级包是否一致, 确认升级完成。

⑥ CLI命令视图

l 根据命令行体系使用操作者的不同特性, 将操作者划分为用户、 用服、 研发三大领域

角色;对应产生三大视图。

p 用户视图( user) 指在网产品的终端用户进入的管理视图。

p 用服视图( engineer) 包括华为用服人员和服务外包人员进入的维护视图。

p 研发视图( developer) 仅限于华为存储的研发人员进入的调试视图。

l 用服领域可以执行超级管理员的所有命令, 并且可以执行用服类专有命令。

l 研发领域可以执行用服可执行的所有命令, 并且可以执行研发类专有命令。

技术分享图片

 技术分享图片


 

a.  告警查询和清除

查询所有告警信息

#show alarm

技术分享图片 

清除指定告警信息

#change alarm clear sequence_list=3424

技术分享图片

3.硬件类故障

① 常见硬件类故障

技术分享图片
 

② 常见告警指示灯状态

红灯亮模块故障;

红灯闪:模块正在启动、定位端口、定位硬盘;

 

蓝灯亮端口的速率值;

蓝灯闪:端口正在传输数据;

蓝灯亮表示8G的FC主机端口模块速率为8G, 10G的iscsi主机端口模块速率为10G,miniSAS级联模块与级联框连接速率为12G。

 

绿灯长亮模块正常、端口的速率值;

绿灯闪:端口正在传输数据、BBU充电、电源模块已接、硬盘传输数据、电源未上电、控制器正在启动、端口模块有热插拔请求;

绿灯亮表示8G的FC主机端口模块速率为4G或2G, 10G的iscsi主机端口模块速率为1G, 12G miniSAS级联模块与级联框连接速率为6G。

 

橙灯亮端口的速率值;

橙灯闪:管理网口正在传输数据、BBU正在放电;

橙灯亮表示1G的iscsi主机端口速率为1G。

橙灯灭表示1G的iscsi主机端口速率低于1G。

以上是关于50华为HCIE-Storage--存储维护与故障处理的主要内容,如果未能解决你的问题,请参考以下文章

9华为HCIE-Storage--存储连线

3华为HCIE-Storage--磁盘

5华为HCIE-Storage--RAID类型

1华为HCIE-Storage--基础知识

26华为HCIE-Storage--Hyper Clone(不支持外部存储,同一控制器)

8华为HCIE-Storage--硬件架构