卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章64334本站已运行4115

使用 Grafana 警报在几分钟内重复警报

使用 grafana 警报在几分钟内重复警报

php小编柚子今天为大家介绍如何使用Grafana警报功能,在几分钟内重复警报,确保重要事件得到及时处理。Grafana是一款流行的开源数据可视化和监控工具,提供了丰富的仪表盘和警报功能。通过设置警报规则和通知方式,我们可以及时发现系统中的异常情况,并采取相应的措施。本文将详细介绍如何使用Grafana警报功能,并分享一些实用的技巧和注意事项,让您轻松应对各种监控场景。

问题内容

使用 Grafana 9.2.2 和 VictoriaMetrics 作为数据源,在满足特定条件时发送警报。 通过将 API 配置为 Webhook 接触点,使用外部服务来传递警报,通过该接触点发送有效负载并进一步处理以在 Slack 上传递。

警报评估行为设置为 - 每 1 小时评估一次,持续 0 秒。希望在满足条件时立即触发警报,并每 1 小时评估一次,因为这是新数据点的频率。

预期行为:满足条件后每 24 小时发出一次警报。

实际行为:一旦满足条件,警报就会被触发(正如它应该的那样)。但是,相同的警报会在 5 分钟内再次发送。

如何处理这个问题?

尝试过的选项:

  1. 通知策略计时 - 在使用 alertnamegrafana-folder 进行分组时,尝试了分组间隔、重复间隔和等待时间,但没有帮助。另外,我尝试使用 alert_uid 进行分组,但这没有得到解释。我是否尝试错误的时间组合(与警报评估行为期结合在一起)。
  2. 收到有效负载后,我需要向 Grafana 发送确认吗?如果是这样,请分享方法或链接您可以找到的任何文档。我找不到任何可以回答是/否以及如何回答的内容。我已将问题隔离到 Grafana,触发的 API 被调用了两次。
  3. 可以选择将警报静音和/或静音。这是这里要遵循的方法吗?如果是,警报被触发一次后是否应该静音 24 小时(因为不想再重复 24 小时)?

谢谢。非常感谢。

解决方法

问题是 Grafana 的多个实例彼此独立运行。我们有 2 个 Grafana pod 正在运行,它们都在服务请求,因此存在重复。 未来需要检查如何在集群模式下运行 Grafana。

卓越飞翔博客
上一篇: 如何在正则表达式中使整个单词可选?
下一篇: Docker容器中的服务器(提供静态reactjs文件)404页面未找到
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏