计算机组成原理 — 服务器 — DELL 服务器常见错误清单及解决办法
Posted 范桂飓
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算机组成原理 — 服务器 — DELL 服务器常见错误清单及解决办法相关的知识,希望对你有一定的参考价值。
目录
文章目录
- 目录
- Dell EMC PowerEdge Servers Troubleshooting Guide
- AMP0302
- AMP0303
- ASR0000
- ASR0001
- ASR0002
- ASR0003
- BAT0002
- BAT0017
- CPU0000
- CPU0001
- CPU0005
- CPU0010
- CPU0023
- CPU0204
- CPU0700
- CPU0701
- CPU0702
- CPU0703
- CPU0704
- FAN0000
- FAN0001
- FAN1201
- HWC1001
- HWC2003
- HWC2005
- MEM0000
- MEM0001
- MEM0007
- MEM0701
- MEM0702
- MEM1205
- MEM1208
- MEM8000
- PCI1302
- PCI1304
- PCI1308
- PCI1320
- PCI1342
- PCI1348
- PCI1360
- PDR0001
- PST0128
- PST0129
- PSU0001
- PSU0002
- PSU0003
- PSU0006
- PSU0016
- PSU0031
- PSU0032
- PSU0033
- PSU0034
- PSU0035
- PSU0036
- PSU0037
- PSU0076
- PSU1201
- PSU1204
- PWR1004
- PWR1005
- PWR1006
- RFM1008
- RFM1014
- RFM1201
- RFM2001
- RFM2002
- RFM2004
- RFM2006
- SEC0031
- SEC0033
- SEL0006
- SEL0008
- SEL0012
- SEL1204
- TMP0118
- TMP0119
- TMP0120
- TMP0121
- VLT0204
- ePSA Error code 2000-0251
Dell EMC PowerEdge Servers Troubleshooting Guide
- https://dl.dell.com/manuals/common/servertroubleshootingguide_en.pdf
AMP0302
The system board <name> current is greater than the upper warning threshold.
系统板 <name> 电流超出适宜范围。
操作:
- 审查系统电源策略。
- 检查系统日志确认电源相关故障。
- 审查系统配置更改。
AMP0303
System board <name> current is outside of range.
系统板 <name> 电流超出适宜范围。
操作:
- 审查系统电源策略。
- 检查系统日志确认电源相关故障。
- 审查系统配置更改。
ASR0000
The watchdog timer expired.
操作系统或应用程序在超时时段内通信失败
操作:
- 检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0001
The watchdog timer reset the system.
操作系统或应用程序在超时时段内通信失败,系统被重设
操作:
- 检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0002
The watchdog timer powered off the system.
操作系统或应用程序在超时时段内通信失败,系统被关闭
操作:
- 检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0003
The watchdog timer power cycled the system.
操作系统或应用程序在超时时段内通信失败,系统在关闭后再次开启。
操作:
- 检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
BAT0002
The system board battery has failed. Check battery.
系统板电池失效。
操作:
- 更换电池。
BAT0017
The <name> battery has failed. Check battery.
电池 <name> 可能出现缺失、故障因为温度问题导致无法充电。
操作
- 检查系统风扇。
- 如非风扇问题,更换电池。
CPU0000
CPU <number> has an internal error (IERR).
CPU <number> 出现内部错误.也许异常出现在处理器之外
操作:
- 审查系统事件日志和操作系统日志。
CPU0001
CPU <number> has a thermal trip. Check CPU heat sink.
CPU <number> 出现热断路,检查 CPU 散热器
操作:
- 检查风扇故障日志。
- 如果未检测到风扇故障,请检查进气孔温度(若适用)并重新安装处理器散热片
CPU0005
CPU <number> configuration is unsupported. Check CPU or Bios revision.
CPU <number> 配置受支持,检查 CPU 或 BIOS 修订版本。系统无法引导,或正在降级运行。
操作:
- 检查所支持的处理器类型的技术规格。
CPU0010
CPU <number> is throttled.
因为温度或电源情况导致 CPU<number>被节流。
操作
- 查阅系统日志排查电源或温度异常。
CPU0023
CPU <number> is absent. Check CPU.
CPU <number> 缺失,检查 CPU。
操作
- 验证处理器安装。
- 如果存在,则重新安装处理器。
CPU0204
CPU voltage is outside of range. Re-seat CPU.
CPU 电压超出范围,重新安装 CPU。电压超出容许范围可能损坏电气组件,或导致系统关闭。
操作
- 关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
CPU0700
CPU <number> initialization error detected. Power cycle system.
检测到 CPU <number> 初始化错误,系统电源关闭然后打开。
操作
- 关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
CPU0701
CPU protocol error detected. Power cycle system.
检测到 CPU 协议错误,系统电源关闭然后打开
操作
- 检查系统和操作系统日志以排查异常。
- 如果未发现异常,则关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
CPU0702
CPU bus parity error detected. Power cycle system.
检测到 CPU 总线奇偶校验错误,系统电源关闭然后打开。
操作
- 检查系统和操作系统日志以排查异常。
- 如果未发现异常,则关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
CPU0703
CPU bus initialization error detected. Power cycle system.
检测到 CPU 总线初始化错误,系统电源关闭然后打开。
操作
- 检查系统和操作系统日志以排查异常。
- 如果未发现异常,则关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
CPU0704
CPU <number> machine check error detected. Power cycle system.
检测到 CPU <number> 机器检查错误,系统电源关闭然后打开。
操作
- 检查系统和操作系统日志以排查异常。
- 如果未发现异常,则关闭系统并断开输入电源一分钟。
- 确保处理器安装正确。
- 重新提供输入电源并打开系统。
FAN0000
Fan <number> RPM is less than the lower warning threshold.
风扇<number>运行速度超出范围。
操作
- 卸下并重新安装风扇。
FAN0001
Fan <number> RPM is outside of range. Check fan.
风扇 <number> 运行速度超出范围。
操作
- 卸下并重新安装风扇。
FAN1201
Fan redundancy lost. Check fans.
风扇发生故障。
操作
- 卸下并重新安装故障的风扇或安装其它风扇。
HWC1001
The <name> is absent. Check hardware.
硬件<name> 缺失,检查硬件。可能导致系统功能降级。
操作
- 重新安装或重新连接硬件。
HWC2003
Storage <name> cable or interconnect failure. Check connection.
存储设备 <name> 电缆或互联故障,请检查连接。可能导致系统功能降级。
操作
- 检查电缆是否存在,重新安装或重新连接。
HWC2005
System board <name> cable connection failure. Check connection.
系统板 <name> 电缆连接故障,请检查连接。可能导致系统功能降级。
操作
- 检查电缆是否存在,然后重新安装或重新连接。
MEM0000
Persistent correctable memory errors detected on a memory device at location(s) <location>.
在内存设备的位置 <location> 处检测到永久可纠正的内存错误。
操作
- 重新安装内存。
MEM0001
Multi-bit memory error on <location>. Re-seat memory.
<location> 处的多位内存错误,重新安装内存。可能导致系统功能降级,操作系统和/或应用程序可能会发生故障。
操作
- 重新安装内存。
MEM0007
Unsupported memory configuration. Check memory <location>.
内存可能安装不正确,配置错误,或者发生故障,内存大小减少。
操作
- 检查内存配置。重新安装内存。
MEM0701
Correctable memory error rate exceeded for <location>.
内存可能无法操作。
操作
- 重新安装内存。
MEM0702
Correctable memory error rate exceeded for <location>. Re-seat memory.
<location> 的可纠正内存错误比率超限,重新安装内存。
操作
- 重新安装内存。
MEM1205
Memory mirror lost on <location>. Power cycle system.
内存可能安装不正确,配置错误,或者发生故障。
操作
- 检查内存配置。重新安装内存。
MEM1208
Memory spare lost on <location>. Power cycle system.(
内存备份不再可用。
操作
- 重新安装内存。
MEM8000
SBE log disabled on <location>. Re-seat memory.
<location> 上 SBE 日志已禁用,重新安装内存。
操作
- 检查系统日志排查内存异常。
- 重新安装位于 location 处的内存。
PCI1302
A bus time-out was detected on a component at bus <bus> device<device> function <func>.
总线 <bus> 设备 <device> 功能 <func> 的组件上检测到总线超时。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1304
I/O channel check error detected. Power cycle system.
检测到 I/O 通道检查错误,系统电源关闭然后打开。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1308
PCI parity error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的 PCI 奇偶校验错误,关闭并打开系统电源。可能导致系统功能降级,PCI 设备可能无法运行,或系统无法运行。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1320
Bus fatal error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的总线严重错误,关闭然后打开系统电源。可能导致系统功能降级,或系统可能无法运行。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1342
A bus time-out was detected on a component at slot <number>.
插槽 <number> 的组件上检测到总线超时。可能导致系统功能降级,或系统可能无法运行。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1348
PCI parity error on slot <number>. Re-seat PCI card.
插槽 <number> 上的 PCI 奇偶校验错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PCI1360
Bus fatal error on slot <number>. Re-seat PCI card.
插槽 <number> 的严重总线错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
- 关闭并打开输入电源,更新组件驱动程序。
- 如果设备可卸下,则重新安装设备。
PDR0001
Fault detected on drive <number>. Check drive.
控制器在磁盘上检测到故障,并已使磁盘脱机。
操作
- 卸下然后重新安装有故障的磁盘。
PST0128
No memory is detected. Inspect memory devices.
系统 BIOS 无法检测到系统中的内存。
操作
- 重新安装内存。
PST0129
Memory is detected, but is not configurable. Check memory devices.
系统 BIOS 检测到内存,但无法基于系统运行对其进行配置。
操作
- 将系统内存安装与支持的系统内存配置进行比较。
PSU0001
PSU <number> failed. Check PSU.
PSU <number> 故障,检查 PSU。
操作
- 卸下并重新安装电源设备。
PSU0002
Predictive failure on PSU <number>. Check PSU.
PSU <number> 上的预测故障,检查 PSU。
操作
- 卸下电源设备并重新安装。
PSU0003
Power input for PSU <number> is lost. Check PSU cables.
PSU <number>电源设备安装正确,但输入源未连接或未起作用。
操作
- 验证输入源连接到设备。
- 验证输入源符合电源设备的操作要求。
PSU0006
Power supply is incorrectly configured. Check PSU.
电源设备 未正确配置,检查 PSU。电源设备的输入类型和额定功率应当相同。
操作
- 安装匹配的电源设备。
PSU0016
PSU <number> is absent. Check PSU.
PSU <number> 电源设备已卸下或出现故障。
操作
- 卸下并重新安装电源设备。
- 检查系统中的线缆和子系统组件以排查损坏。
PSU0031
Cannot communicate with PSU <number>. Re-seat PSU.
电源设备可以运行,但是电源设备的监控已降级,系统性能将降级。
操作
- 卸下并重新安装电源设备。
PSU0032
The temperature for power supply <number> is in a warning range.
电源设备 <number> 的温度在警告范围内。
操作
- 检查系统运行环境,包括通风和进气孔温度。
- 查看温度和热组件故障的日志。
PSU0033
PSU temperature outside of range. Check PSU.
PSU 温度超出范围,请检查 PSU。
操作
- 检查系统运行环境,包括通风和进气孔温度。
- 查看温度和热组件故障的日志。
PSU0034
An under voltage fault detected on PSU <number>. Check power source.
在 PSU <number> 上检测到电压过低故障,请检查电源。
操作
- 卸下并重新安装电源设备。
- 检查系统中的线缆和子系统组件以排查损坏。
PSU0035
Over voltage fault on PSU <number>. Check PSU.
在 PSU <number> 上发生电压高过故障,请检查 PSU。
操作
- 检查输入电源或重新安装电源设备。
PSU0036
An over current fault detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到电流过高故障,请检查 PSU。
操作
- 卸下并重新安装电源设备。
- 检查系统中的线缆和子系统组件以排查损坏。
PSU0037
Fan failure detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到风扇故障,请检查 PSU。
操作
- 检查风扇是否阻塞。
PSU0076
PSU wattage mismatch; PSU <number> = <value >watts
PSU 功率不匹配;PSU <number> = <value > 瓦特 ,电源设备的输入类型和额定功率应当相同。
操作
- 安装匹配的电源设备。
PSU1201
Power supply redundancy is lost.
电源设备冗余缺失。
操作
- 检查输入电源。
- 重新安装电源设备。
PSU1204
PSU redundancy degraded. Check PSU cables.
PSU 冗余降级,检查 PSU 电缆。电源设备异常、电源设备资源变化,或系统电源资源变化。
操作
- 检查事件日志排查电源设备故障。
- 查看系统配置和功耗。
PWR1004
The system performance degraded because power capacity has changed.
因为电源容量变化系统性能已降级。
操作
- 检查事件日志排查电源设备故障。
- 查看系统配置和功耗,并据此升级或安装电源设备。
PWR1005
The system performance degraded because the user-defined power capacity has changed.
用户定义的电源设置影响系统运行。
操作
- 如果是意外导致,查看系统配置变化和电源策略。
PWR1006
System power demand exceeds capacity. System halted.
系统电源需求超出容量,系统已停止。
操作
- 查看系统配置,升级电源设备或降低系统功耗。
RFM1008
Removable Flash Media <name> failed. Check SD Card.
可移动的闪存介质 <name> 出现故障,检查 SD 卡。SD 卡读取或写入过程中报告了错误。
操作
- 重置闪存介质。
RFM1014
Removable Flash Media <name> is write protected. Check SD Card.
可移动的闪存介质 <name> 为写保护状态,检查 SD 卡。该卡被 SD 卡上的物理锁进行了写保护,写保护状态的卡无法使用。
操作
- 如果是意外导致,卸下介质并禁用写保护。
RFM1201
Internal Dual SD Module redundancy is lost. Check SD Card.
其中一块或两块 SD 卡工作不正常。
RFM2001
Internal Dual SD Module <name> is absent. Check SD Card.
未检测到 SD 卡模块或该卡未安装。
操作
- 如果无意如此,则重新安装 SD 模块。
RFM2002
Internal Dual SD Module <name> is offline.
SD 卡模块已安装,但可能安装不正确,或配置不正确。
操作
- 重新安装 SD 模块。
RFM2004
Internal Dual SD Module <name> failed. Check SD Card.
SD 卡模块已安装,但配置不正确,或无法初始化。
操作
- 重新安装 SD 模块,然后卸下并重新安装 SD 卡。
RFM2006
Internal Dual SD Module <name> is write protected.
此模块为写保护,更改可能无法写入到介质。
操作
- 如果是意外导致,卸下介质并禁用写保护。
SEC0031
Intrusion detected. Check chassis cover.
检测到侵入,检查机箱盖。
操作
- 关闭机箱,检查系统日志。
SEC0033
Intrusion detected. Check chassis cover.
电源关闭状态下机箱打开。
操作
- 关闭机箱并验证硬件资源。
- 检查系统日志。
SEL0006
All event logging is disabled.
当用户禁用所有事件日志。
操作
- 若是意外导致,则重新启用日志。
SEL0008
Log is full.
日志已满。日志已满时,其他事件将不会写入到日志。早期的事件可能被覆盖并丢失。如果用户禁用了事件记录,也可能显示此消息。
操作
- 备份并清除日志。
SEL0012
Could not create or initialize the system event log.
无法创建或初始化系统事件日志。系统事件日志初始化失败,将不会捕获平台状态和故障事件,某些管理软件不会报告平台异常。
操作
- 重新引导管理控制器或 iDRAC。
- 关闭然后打开输入电源。
SEL1204
Unknown system hardware failure.
未知系统硬件故障。
操作
- 将系统重新配置为所支持的最低配置。
TMP0118
System inlet temperature is outside of range.
环境气温过低.
操作
- 检查系统运行环境。
TMP0119
System inlet temperature is outside of range.
环境气温过低。
操作
- 检查系统运行环境。
TMP0120
System inlet temperature is outside of range.
环境气温过高,或者可能一个或多个风扇发生故障。
操作
- 检查系统运行环境并查看事件日志排查风扇故障。
TMP0121
System inlet <name> temperature is outside of range. Check Fans.
环境气温过高,或者可能一个或多个风扇发生故障。
操作
- 检查系统运行环境并查看事件日志排查风扇故障。
VLT0204
System board voltage is outside of range.
系统硬件检测到电压过高或过低的情况。如果连续出现多个电压异常,系统可能切换到故障安全模式。
操作
- 查看系统日志了解电源设备异常。
- 将系统重新配置为最低配置,检查并重新安装系统电缆。
ePSA Error code 2000-0251
这仅与服务器中的 BIOS 事件相关。
操作:
- 清除 BIOS 中的事件日志。
- 更新到最新 BIOS。
- 重复运行 ePSA 诊断程序。
- 如果诊断仍然产生错误代码,转至 ePSA 在线工具。
以上是关于计算机组成原理 — 服务器 — DELL 服务器常见错误清单及解决办法的主要内容,如果未能解决你的问题,请参考以下文章
计算机基础——DNS原理,让开发常忘的a记录,ns记录和cname都是什么