告警策略(工作负载级别)
KubeSphere 支持针对节点和工作负载的告警策略。本教程演示如何为项目中的工作负载创建告警策略并配置邮件通知。有关如何为节点配置告警策略,请参阅告警策略(节点级别)。
准备工作
- 您需要启用 KubeSphere 告警和通知。
- 您需要配置邮件服务器。
- 您需要创建一个企业空间、一个项目和一个帐户(例如
project-regular
)。该帐户必须已邀请至该项目,并具有operator
角色。有关更多信息,请参阅创建企业空间、项目、帐户和角色。 - 您需要确保项目中存在工作负载。如果项目中没有工作负载,请进入应用负载下的应用页面,点击部署示例应用快速部署一个应用。有关更多信息,请参阅部署 Bookinfo 和管理流量。
动手实验
步骤 1:进入控制台
登录 KubeSphere 控制台并进入项目,在左侧导航栏中选择监控告警下的告警策略,然后在页面右侧点击创建。
步骤 2:配置基本信息
在弹出的对话框中配置以下信息,然后点击下一步。
- 名称:告警策略的名称,例如
alert-demo
。该名称将用作告警策略的唯一标识符,请确保名称简洁明了。 - 别名:帮助您更好地区分不同的告警策略。该字段支持中文字符。
- 描述:告警策略的简单介绍。
步骤 3:选择监控目标
您可以选择部署、有状态副本集和守护进程集三种工作负载作为监控目标。在本示例中,选择部署以及 reviews-v1
和 details-v1
作为监控目标,然后点击下一步。
步骤 4:添加告警规则
-
点击添加规则创建告警规则。告警规则中包含指标类型、检查周期、连续次数、指标阈值和告警级别等多个参数可供设置。
- 检查周期(规则下的第二个字段):表示两次指标检查的间隔,例如
2 分钟/周期
表示每两分钟检查一次。 - 连续次数(规则下的第三个字段):表示至少连续几次检查到指标符合条件时才触发告警。
- 检查周期(规则下的第二个字段):表示两次指标检查的间隔,例如
-
在本示例中,将告警规则设置为
内存用量
、1 分钟/周期
、连续 2 次
、>
、20
MiB、重要告警
。该告警规则表示 KubeSphere 每 1 分钟检查一次内存用量,当连续 2 次检查到内存用量大于 20 MiB 时触发重要告警。 -
点击 √ 保存规则,然后点击下一步。
备注
您可以为以下指标创建工作负载级别的告警策略:
- CPU:
CPU 用量
- 内存:
内存用量(包含缓存)
和内存用量
- 网络:
网络发送数据速率
和网络接收数据速率
- 工作负载:
部署副本不可用率
- CPU:
步骤 5:设置通知规则
-
通知有效时间用于设置通知邮件的发送时间,例如
09:00
至19:00
。通知渠道目前只支持邮箱。您可以在通知列表中添加被通知的成员的邮箱地址。 -
自定义重复规则用于定义通知邮件的重复发送周期和重复发送次数。如果告警未被清除,通知邮件将按重复规则重复发送。您可以为不同的告警级别设置不同的重复规则。例如,将重要告警设置为
每 5 分钟警告一次
和最多重发 3 次
。 -
点击创建。告警策略创建后显示在告警策略页面。
步骤 6:查看告警策略
告警策略创建成功后,您可以进入其详情页面查看状态、告警规则、监控目标、通知规则、告警历史等信息。点击更多操作,然后从下拉菜单中选择更改状态可启用或禁用当前告警策略。
页面内容