HPE iLO NMI 看门狗驱动程序¶
适用于基于 iLO 的 ProLiant 服务器¶
上次审查:2018/08/20
HPE iLO NMI 看门狗驱动程序是一个内核模块,为 iLO“向系统生成 NMI”虚拟按钮提供基本看门狗功能和处理程序。
本文档中所有对 iLO 的引用均表示它也适用于 iLO2 及后续所有代。
看门狗功能像任何其他常见看门狗驱动程序一样启用。也就是说,需要启动一个应用程序来启动看门狗定时器。工具/testing/selftests/watchdog/ 中存在一个名为 watchdog-test.c 的基本应用程序。只需编译 C 文件并启动它即可。如果系统进入不良状态并挂起,则 HPE ProLiant iLO 定时器寄存器将不会及时更新,并且会发生硬件系统重置(也称为自动服务器恢复 (ASR))事件。
hpwdt 驱动程序还具有以下模块参数
soft_margin
允许用户设置看门狗定时器值。默认值为 30 秒。
timeout
soft_margin 的别名。
pretimeout
允许用户设置看门狗预超时值。这是在超时之前向系统发送 NMI 的秒数。将该值设置为零会禁用预超时 NMI。默认值为 9 秒。
nowayout
基本看门狗参数,不允许重新启动定时器或逃避即将到来的 ASR。默认值在编译内核时设置。如果将其设置为“Y”,则一旦启动看门狗,就无法禁用它。
kdumptimeout
收到 NMI 后调用 panic 之前应用的最小超时时间(以秒为单位)。(-1) 禁用看门狗。当值 > 0 时,定时器会重新编程为该值或当前超时值中的较大值。
- 注意
有关看门狗驱动程序的一般信息,包括 /dev/watchdog 的 ioctl 接口,请参见Linux 看门狗驱动程序 API和Linux IPMI 驱动程序
由于 iLO 硬件的限制,如果启用了 NMI 预超时,则只能将其设置为 9 秒。尝试将 pretimeout 设置为其他非零值将被舍入,可能舍入为零。用户应在尝试设置 pretimeout 或 timeout 后验证 pretimeout 值。
收到来自 iLO 的 NMI 后,hpwdt 驱动程序将启动 panic。这是为了允许收集崩溃转储。用户有责任为 kdump 正确配置系统。
panic 时,默认的 Linux 内核行为是打印内核墓碑并永远循环。这通常不是看门狗用户想要的。
- 对于那些希望了解更多信息的人,请参阅
内核的命令行参数 (panic=)
您的 Linux 发行版特定文档。
如果 hpwdt 没有收到与即将到期的定时器相关的 NMI,如果定时器未更新,iLO 将在超时时继续重置系统。
--
HPE iLO NMI 看门狗驱动程序和文档最初由 Tom Mingarelli 开发。