- 前提条件
- 查看告警消息
- 查看告警策略
- 查看最近通知
- 验证邮件通知
- 添加处理意见
告警消息记录了在节点级别的告警策略中,所有已发出的满足告警规则的告警信息。在 告警策略 —— 节点级别 这篇文档中,演示了创建一个节点级别的告警策略并发送邮件通知,同时所有平台发出的告警消息都已经记录在了告警消息列表中,管理员可以进一步查看告警详情、监控指标、告警策略、最近通知和处理意见等详细信息。
前提条件
已创建了告警策略并收到了告警消息,若还未创建请参考 告警策略 —— 节点级别。
查看告警消息
以集群管理员 cluster-admin 账号登录 KubeSphere,点击 「平台管理」,选择 「监控中心」。
点击 「告警消息」,在告警消息列表中查看全部的告警消息。由于我们在告警策略的示例中设置的监控对象为 3 台主机,并且这三台主机在示例中的内存使用率都大于告警的阈值 50%,因此在告警消息列表中看到了 3 条与监控目标对应的告警消息。
- 点击其中一条告警消息进入详情页,在告警详情中查看监控目标主机的内存利用率,可以看到在最近一段时间内内存利用率持续高于设定的阈值 50%,因此触发了告警。
查看告警策略
切换到 「告警策略」 查看本条告警消息对应的告警策略,可以看到主机告警策略的触发规则正是在上一篇告警策略示例中设定的。
查看最近通知
点击 「最近通知」 即可看到当前的通知人已收到了 3 条告警通知,因为当前监控主机的告警指标内存利用率连续 2 次超过了阈值 50%,通知规则设置为 每 5 分钟警告一次,最多重发 3 次。
验证邮件通知
登录通知邮箱即可看到 KubeSphere 的邮件服务器给通知人发送的告警消息,如下所示。示例邮箱先后一共收到了 9 封邮件,这是因为告警目标 3 台主机的内存利用率都 连续 2 次 超过了阈值 50%,并且告警的通知规则设置为 每 5 分钟警告一次,最多重发 3 次。
添加处理意见
点击 「处理意见」 可以对当前告警进行处理,添加意见信息。例如,由于当前告警主机的内存利用率高于阈值,所以我们可以在处理意见的窗口中添加一条信息:需要对该主机加污点,不允许新的 Pod 调度。