1. 登录 OCP。
    2. 单击左导航栏告警>告警订阅
    3. 在默认的订阅列表界面可查看已订阅信息,并可对已有订阅信息进行查看、编辑、删除操作。

    image.png

    • 订阅集群下拉列表中选择需要订阅的目标集群 。
    • 勾选告警项组,这里告警项组是 OCP 默认配置的不同角色关注的告警项集合,一般系统管理员或数据库管理员选择dba即可。OCP 有 4 个初始化分组,系统内建分组可以编辑,无法删除。
    • 告警方式列表中针对不同的告警登记,选择不同的告警通道即可,推荐停服、严重两个级别勾选默认、短信、电话通道,其他级别只勾选钉钉短信通道即可。

    不同告警等级列表如下:

    级别英文含义中文含义颜色告警级别说明
    1Down停服完全不可用,需要立即介入修复,如 OB服务启动失败,此类告警建议勾选全部告警通道,保证所有关注者道都能收到。
    2Critical严重系统可用性下降,需要紧急修复,避免完全不可用, 如 机器内存使用率大于90%持续3分钟,此类告警建议勾选钉钉、短信通道,保证管理者用户能收到消息。
    3Alert警告系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降, 如 OB租户连接数大于上限的80%,此类告警建议勾选钉钉或短信,引起订阅者关注即可。
    4Caution注意

    根据趋势判断,系统关键性能指标正在下降,但是还没达到触发警告的程度,此时可以通过排查发现潜在的问题,避免警告产生(保留类型,目前尚未有匹配的告警项),此类告警建议勾选钉钉即可。

    5Info提醒绿

    操作提醒,本质上不是告警,通常是管理员执行重要操作,如 管理员执行集群下线操作,此类告警一般勾选默认/钉钉通道即可。

    1. 完成订阅后,可以在告警订阅**>个人接受设置**中,对不同告警通道的告警接受频率进行设置。
    • 接受告警通知:此开关为消息接受总开关,关闭后订阅者将接收不到任何通道的告警消息,一般用作告警异常时暂时关闭告警接受消息来使用。
    • 接受恢复通知:默认 OCP 告警项发出告警后,当触发告警条件解除后,会默认发送一条告警恢复通知,关闭此开关后,订阅者将不会受到告警恢复通知;