概述

    IPMI是计算机系统的远程“关闭”或“带外”管理的标准接口。它可以独立于操作系统直接从所谓的“带外”管理卡监视硬件状态。

    Zabbix IPMI监控仅适用于支持IPMI的设备(HP iLO, DELL DRAC, IBM RSA, Sun SSP, 等等).

    从Zabbix 3.4开始,添加了一个新的IPMI管理器进程来安排IPMI轮询器进行IPMI检查。现在,主机始终只由一个IPMI轮询器轮询,从而减少了与BMC控制器的打开连接数。通过这些更改,可以安全地增加IPMI轮询器的数量,而无需担心BMC控制器过载。 启动至少一个IPMI轮询器时,将自动启动IPMI管理器进程。

    也可以参考IPMI检查的。

    配置

    主机配置

    主机必须配置为处理IPMI检查。必须添加IPMI接口,必须定义相应的IP和端口号,并且必须定义IPMI认证参数。

    更多细节请查看主机定义

    服务器配置

    取消注释,并设置poller计数为3,如下:

    保存文件,然后重新启动zabbix_server。

    监控项配置

    配置主机级别的时:

    超时和会话终止

    IPMI消息超时和重试计数在OpenIPMI库中定义。由于目前OpenIPMI的设计,无论在接口还是监控项级别都不能在Zabbix中使这些值进行配置。

    LAN的IPMI会话不活动超时时间为60 +/- 3秒。目前无法使用OpenIPMI定期发送激活会话命令。如果没有从Zabbix到特定BMC的IPMI项检查超过在BMC中配置的会话超时,则超时超时后的下一次IPMI检查将由于单个消息超时、重试或接收错误而超时。之后,打开一个新的会话,并启动BMC的完全重新扫描。如果要避免BMC的不必要的rescans,建议将IPMI监控项轮询间隔设置为低于BMC中配置的IPMI会话不活动超时。

    关于IPMI离散传感器的注意事项

    要在主机上找到传感器启动Zabbix服务器,启用DebugLevel=4。等待几分钟,并在Zabbix服务器日志文件中查找传感器发现记录:

    开始的第一个参数是“reading_type”。从规范中使用“表42-1,事件/读取类型代码范围”来解码“reading_type”代码。我们示例中的大多数传感器都有“reading_type:0x1”,这意味着是“threshold”传感器。 “表42-3,传感器类型代码”表示:“类型:0x1”表示温度传感器;“类型:0x2” - 电压传感器;“类型:0x4” - 风扇等阈值传感器有时称为“模拟”传感器,因为它们测量连续参数,如温度,电压,每分钟转数。

    另一个例子 - 一个带有“read_type:0x3”的传感器。“表42-1,事件/读取类型代码范围”表示读取类型代码02h-0Ch表示“通用离散”传感器。离散传感器具有多达15个可能的状态(换句话说-最多15个有意义的位)。例如,对于具有“type:0x7”的传感器“CATERR”,“表42-3,传感器类型代码”表示此类型“处理器”,各个位的含义是:00h(最低有效位)- IERR ;01h - 散热等。

    在我们的示例中有几个传感器具有“reading_type:0x6f”。对于这些传感器,“表42-1,事件/读取类型代码范围”建议使用“表42-3,传感器类型代码”来解码位的含义。 例如,传感器“Power Unit Stat”的类型为“0x9”,表示“Power Unit”。 Offset 00h表示“PowerOff / Power Down”。 换句话说,如果最低有效位为1,则服务器断电。为了测试这个位,可以使用band与掩码1的功能。触发表达式可能就像

    警告服务器关机。

    关于OpenIPMI-2.0.16,2.0.17,2.0.18和2.0.19中离散传感器名称的注释

    OpenIPMI-2.0.16,2.0.17和2.0.18中的离散传感器的名称通常在附近附加一个额外的 “” (或其它数字或字母)。例如,当 ipmitool 和OpenIPMI-2.0.19将传感器名称显示为 “” 或 “CATERR“时,在OpenIPMI-2.0.16,2.0.17和2.0.18中,名称分别为 ”” 或 “CATERR0“。

    当使用OpenIPMI-2.0.16,2.0.17和2.0.18配置IPMI项目时,请在IPMI代理监控项的IPMI传感器字段中使用以“0”结尾的名称。当你的Zabbix服务器升级到使用OpenIPMI-2.0.19(或更高版本)的新Linux发行版时,具有这些IPMI离散传感器的监控项将变为“不支持”。 你必须更改其IPMI传感器名称(最后删除“0”),并等待一段时间才能再次转为”Enabled”。

    关于阈值和离散传感器同时可用的注意事项
    连接终止注意事项

    如果不执行IPMI检查(由于任何原因:所有主机IPMI监控项禁用/不支持、主机已禁用/已删除、主机维护等),IPMI连接将从Zabbix服务器或代理服务器终止3到4小时,具体时间取决于Zabbix服务器/代理服务器何时启动。