故障排查 PowerEdge iDRAC 运维干货
Dell PowerEdge 服务器亮黄灯?3步快速排查故障代码
H
高级系统工程师 - Alex
Haodell Technical Team
2025年5月15日
阅读时间约 8 分钟
当您走进机房,发现 Dell PowerEdge 服务器的前面板状态指示灯从健康的蓝色变成了闪烁的琥珀色(黄色/橙色),这通常意味着硬件出现了某种异常。
不要惊慌,Dell 服务器提供了完善的诊断机制。以下是标准的排查步骤:
第一步:查看 LCD 液晶屏报错信息
大多数 PowerEdge 机架式服务器(如 R740, R750, R760)的前面板都配有一个小型的 LCD 液晶显示屏。
- 如果屏幕变色(通常是橙色),请查看屏幕上滚动的文本。
- 记录下显示的错误代码(Error Code),例如
E1310或PDR1001。 - 记录下伴随的简短描述,例如 “Fan 4 speed outside of range”(4号风扇转速异常)。
常见代码示例:
- PSU0006: 电源模块输入丢失(通常是某路电源线松脱)。
- MEM0001: 内存可纠正错误(多位错误可能导致故障)。
- PDR1001: 硬盘故障预警(Predictive Failure)。
第二步:登录 iDRAC 查看详细日志
如果服务器没有 LCD 屏幕,或者您不在现场,iDRAC(Integrated Dell Remote Access Controller)是最佳的诊断工具。
- 在浏览器输入 iDRAC 的 IP 地址并登录。
- 导航至 Maintenance (维护) -> System Event Log (系统事件日志)。
- 查看最新的 Critical (严重) 或 Warning (警告) 级别的日志。
iDRAC 的日志通常比 LCD 屏幕更详细,它会告诉您具体是哪一根内存条(例如 DIMM_A1)出了问题,或者具体是哪个硬盘插槽(Slot 0)有坏道预警。
第三步:执行 “Flea Power Drain”(释放静电)
很多时候,BMC(基板管理控制器)的误报可以通过释放静电来解决。这被称为 “Flea Power Drain”。
操作步骤:
- 正常关机:关闭服务器操作系统。
- 拔掉电源:拔掉服务器背后的所有电源线。
- 长按开关:长按前面板的电源开机按钮 至少 30 秒。这一步是为了耗尽主板电容中残留的电量,重置 BMC 状态。
- 接电开机:插回电源线,等待 2 分钟让 iDRAC 初始化,然后开机。
如果开机后黄灯消失,说明只是传感器误报或临时状态异常。如果黄灯依旧,则确认是硬件实体故障。
还是无法解决?
如果您确认了硬件故障(如硬盘亮黄灯、电源模块损坏),请不要尝试自行拆解非热插拔部件。
联系上海皓戴获取原厂备件支持: 我们提供 Dell 全系列服务器的原厂备件,包括停产老机型。
- 急救热线:400-888-XXXX
- 服务承诺:上海全境最快 2 小时带件上门。
警告:使用非原厂或拆机硬盘可能会导致 RAID 阵列无法识别,甚至数据丢失。请务必使用带有 Dell 认证固件的原厂硬盘。