11. 维护

    概述

    有两种维护类型可选:一种是有数据收集;另一种是无数据收集。

    在“有数据收集”的维护期里,触发器像往常一样正常处理,事件也会在需要的时候被创建。然而,对于正处在维护期的主机来说,如果在动作配置里勾选了 维护期暂停操作(Pause operations while in maintenance) 选项,那么问题升级会被暂停。在这种情况下,只要维护期间持续,可能包含的发送通知或者远程命令的升级步骤会被忽略。

    比如,有三个升级步骤原计划是在问题发生后的第0分钟、30分钟和60分钟分别执行。现在定义一个半小时的维护期,持续时间刚好是从问题发生后的第10分钟到第40分钟。那么受维护期的影响,原计划在第30分钟和60分钟执行的步骤会被推迟半个小时。也就是说,步骤二会在问题发生后的第60分钟执行,步骤三会在问题发生后的第90分钟执行(假设问题仍然存在)。类似的,如果在维护期发生问题,那么问题升级会在维护期结束后开始。

    如果需要在维护期间正常接收问题通知(没有延迟),必须在动作配置里取消勾选 维护期暂停操作(Pause operations while in maintenance) 选项。

    只要有一个主机(触发器表达式中使用到的主机)不在维护模式里,Zabbix就可能会发送问题通知。

    在维护期间,Zabbix server必须处于运行状态。Timer进程负责在每分钟的第0秒进行主机是否处于维护状态的切换。Zabbix proxy节点不论在什么维护类型(包含“无数据收集”维护)下都会收集数据。只不过如果是“无数据收集”类型,这些数据后来会被Zabbix server节点忽略。

    当“无数据收集”维护期间刚结束的时候,使用了nodata()函数的触发器不会被触发。这些触发器在下一次检查以后才可能会被触发。

    如果在主机处于维护状态的时候添加了一个日志相关的监控项,那么当维护结束时,只会收集自维护结束以来的新日志文件内容。

    为确保重复性维护期(每天,每周,每月)的行为在的预期之中,Zabbix的所有部件都应该使用相同的时区。

    配置

    配置维护期:

    • 单击 创建维护期间(Create maintenance period) (或者单击已存在的维护期的名称)

    维护(Maintenance)选项卡包含了常见的维护期属性:

    所有必填输入字段都标有红色星号。

    周期(Periods)选项卡允许您定义维护发生的确切天数和小时数。单击 新建(New) 会打开一个 维护周期(Maintenance period) 表单,可灵活配置维护期间的时间段 - 每天、每周、每月或者仅一次。

    每天和每周期间有一个 每天(Every day)/每周(Every week) 参数,默认值是1。如果设置为2,那么维护期间就是每两天或者每两周执行一次,以此类推。起始日期或星期是 自启用 时间起作用时的日期或星期。

    比如,启用自从(Active since) 设置为2013-09-06 12:00,如果有一个在23:00开始的为期一个小时的维护期间,每两天执行一次,那么第一次维护期间将会开始于2013-09-06 23:00,第二次维护期间开始于2013-09-08 23:00。或者,再举个例子,如果还是那个相同的 启用自从(Active since),每两天执行一次,每次一小时,开始时间设定为01:00,那么,第一次维护期间将开始于2013-09-08 01:00,第二次开始于2013-09-10 01:00。

    主机(Hosts) & 主机组(Groups)选项卡允许选择需要维护的主机和主机组。

    11. 维护 - 图1

    如果选择了某个父主机组,那么会隐式的选中其所有内嵌的主机组。因此,维护也将在内嵌的主机组的主机上执行。

    显示

    主机名称旁边的橙色扳手图标表示该主机正处于维护状态。在 监测中(Monitoring) → 仪表板(Dashboard) 以及 资产记录(Inventory) → 主机(Hosts) → 主机资产记录(Host inventory) 页面,都可能看到这个维护标志。

    当鼠标指针停留在扳手图标上面的时候会显示维护的详细信息。

    此外,维护中的主机在 监测中(Monitoring) → 拓扑图(Maps) 中获得橙色背景,在 配置(Configuration) → 主机(Hosts) 中其状态显示为“维护中(In maintenance)”。