故障排查 PowerEdge iDRAC 运维干货

Dell PowerEdge 服务器亮黄灯?3步快速排查故障代码

H
高级系统工程师 - Alex
Haodell Technical Team
2025年5月15日
阅读时间约 8 分钟

当您走进机房,发现 Dell PowerEdge 服务器的前面板状态指示灯从健康的蓝色变成了闪烁的琥珀色(黄色/橙色),这通常意味着硬件出现了某种异常。

不要惊慌,Dell 服务器提供了完善的诊断机制。以下是标准的排查步骤:

第一步:查看 LCD 液晶屏报错信息

大多数 PowerEdge 机架式服务器(如 R740, R750, R760)的前面板都配有一个小型的 LCD 液晶显示屏。

  1. 如果屏幕变色(通常是橙色),请查看屏幕上滚动的文本。
  2. 记录下显示的错误代码(Error Code),例如 E1310PDR1001
  3. 记录下伴随的简短描述,例如 “Fan 4 speed outside of range”(4号风扇转速异常)。

常见代码示例:

  • PSU0006: 电源模块输入丢失(通常是某路电源线松脱)。
  • MEM0001: 内存可纠正错误(多位错误可能导致故障)。
  • PDR1001: 硬盘故障预警(Predictive Failure)。

第二步:登录 iDRAC 查看详细日志

如果服务器没有 LCD 屏幕,或者您不在现场,iDRAC(Integrated Dell Remote Access Controller)是最佳的诊断工具。

  1. 在浏览器输入 iDRAC 的 IP 地址并登录。
  2. 导航至 Maintenance (维护) -> System Event Log (系统事件日志)
  3. 查看最新的 Critical (严重)Warning (警告) 级别的日志。

iDRAC 的日志通常比 LCD 屏幕更详细,它会告诉您具体是哪一根内存条(例如 DIMM_A1)出了问题,或者具体是哪个硬盘插槽(Slot 0)有坏道预警。

第三步:执行 “Flea Power Drain”(释放静电)

很多时候,BMC(基板管理控制器)的误报可以通过释放静电来解决。这被称为 “Flea Power Drain”。

操作步骤:

  1. 正常关机:关闭服务器操作系统。
  2. 拔掉电源:拔掉服务器背后的所有电源线。
  3. 长按开关:长按前面板的电源开机按钮 至少 30 秒。这一步是为了耗尽主板电容中残留的电量,重置 BMC 状态。
  4. 接电开机:插回电源线,等待 2 分钟让 iDRAC 初始化,然后开机。

如果开机后黄灯消失,说明只是传感器误报或临时状态异常。如果黄灯依旧,则确认是硬件实体故障。

还是无法解决?

如果您确认了硬件故障(如硬盘亮黄灯、电源模块损坏),请不要尝试自行拆解非热插拔部件。

联系上海皓戴获取原厂备件支持: 我们提供 Dell 全系列服务器的原厂备件,包括停产老机型。

  • 急救热线:400-888-XXXX
  • 服务承诺:上海全境最快 2 小时带件上门。

警告:使用非原厂或拆机硬盘可能会导致 RAID 阵列无法识别,甚至数据丢失。请务必使用带有 Dell 认证固件的原厂硬盘。

遇到类似的技术难题?

上海皓戴拥有 15 年企业级 IT 服务经验,我们的工程师团队随时待命,为您提供原厂级技术支持。