您正在查看 KubeSphere 版本的文档:v3.0.0

KubeSphere v3.0.0 版本的文档已不再维护。您现在看到的版本来自于一份静态的快照。如需查阅最新文档,请点击 最新版本

告警策略(工作负载级别)

KubeSphere 支持针对节点和工作负载的告警策略。本教程演示如何为项目中的工作负载创建告警策略并配置邮件通知。有关如何为节点配置告警策略,请参阅告警策略(节点级别)

准备工作

动手实验

步骤 1:进入控制台

登录 KubeSphere 控制台并进入项目,在左侧导航栏中选择监控告警下的告警策略,然后在页面右侧点击创建

alerting_policy_workload_level_create

步骤 2:配置基本信息

在弹出的对话框中配置以下信息,然后点击下一步

  • 名称:告警策略的名称,例如 alert-demo。该名称将用作告警策略的唯一标识符,请确保名称简洁明了。
  • 别名:帮助您更好地区分不同的告警策略。该字段支持中文字符。
  • 描述:告警策略的简单介绍。

alerting_policy_workload_level_basic_info

步骤 3:选择监控目标

您可以选择部署有状态副本集守护进程集三种工作负载作为监控目标。在本示例中,选择部署以及 reviews-v1details-v1 作为监控目标,然后点击下一步

alerting_policy_workload_level_monitoring_target

步骤 4:添加告警规则

  1. 点击添加规则创建告警规则。告警规则中包含指标类型、检查周期、连续次数、指标阈值和告警级别等多个参数可供设置。

    • 检查周期(规则下的第二个字段):表示两次指标检查的间隔,例如 2 分钟/周期表示每两分钟检查一次。
    • 连续次数(规则下的第三个字段):表示至少连续几次检查到指标符合条件时才触发告警。

    alerting_policy_workload_level_alerting_rule

  2. 在本示例中,将告警规则设置为内存用量1 分钟/周期连续 2 次>20 MiB、重要告警。该告警规则表示 KubeSphere 每 1 分钟检查一次内存用量,当连续 2 次检查到内存用量大于 20 MiB 时触发重要告警。

  3. 点击 保存规则,然后点击下一步

    备注

    您可以为以下指标创建工作负载级别的告警策略:

    • CPU:CPU 用量
    • 内存:内存用量(包含缓存)内存用量
    • 网络:网络发送数据速率网络接收数据速率
    • 工作负载:部署副本不可用率

步骤 5:设置通知规则

  1. 通知有效时间用于设置通知邮件的发送时间,例如 09:0019:00通知渠道目前只支持邮箱。您可以在通知列表中添加被通知的成员的邮箱地址。

  2. 自定义重复规则用于定义通知邮件的重复发送周期和重复发送次数。如果告警未被清除,通知邮件将按重复规则重复发送。您可以为不同的告警级别设置不同的重复规则。例如,将重要告警设置为每 5 分钟警告一次最多重发 3 次

    alerting_policy_workload_level_notification_rule

  3. 点击创建。告警策略创建后显示在告警策略页面。

步骤 6:查看告警策略

告警策略创建成功后,您可以进入其详情页面查看状态、告警规则、监控目标、通知规则、告警历史等信息。点击更多操作,然后从下拉菜单中选择更改状态可启用或禁用当前告警策略。