在有计划的系统中断时,一串稳定的、不必要的噪音警报可能是主要的干扰。你需要找到一种平衡,既能过滤掉杂音,又能保持可观察性和对系统其余部分的警报。
有了静音规则New Relic的警报,您可以在维护窗口、部署和测试等计划中断期间关闭通知。
通过应用muting规则,您将最小化过度muting的风险,通过使用我们所知道的所有上下文元数据创建规则来识别违反实体和信号,它提供了更多的深度,而不仅仅是启用或禁用警报条件。通过这种方式,您可以针对受计划中断影响的系统特定子集。
此外,通过在这些期间保持警报条件运行但保持静默,您可以继续观察实体何时从维护中恢复并恢复到健康状态。
你创建和管理静音规则使用New Relic Alerts UI或NerdGraph API explorer。
什么是静音规则?
静音规则会覆盖您在New Relic中定义的警报策略和条件,因此您可以在已知的系统中断期间屏蔽通知。一个muting规则包含一组条件,这些条件与违规事件中出现的大量属性和标记相匹配,包括:
- 警告策略和条件名称
- 应用程序和服务名称
- 主机名
- AWS标签
- Kubernetes标签
- 任何其他与您的实体或开放遥测相关的标签
静音规则是如何工作的
静音规则告诉New Relic如何在创建后识别单个违规行为,但在事件打开之前。它们覆盖警报的默认生命周期,以指示它不应该发送通知。
使用静音规则,您的正常警报事件生命周期得到维护;唯一的变化是事件是否触发通知。违规和事件仍然打开,并且运行状况指示器在您通过维护窗口时显示实体的当前状态。
当静音规则中定义的条件与违规事件匹配时,该违规将被标记为“静音”。"当禁用违规时,将以以下方式修改事件生命周期:
- 当一个静音违规打开一个事件时,将不会发送一个“打开事件”通知。
- 如果没有被静音的任何其他违规与该事件相关联,则将发送“open incident”通知。
- 如果一个事件发送了一个“open incident”通知,那么所有后续事件都将触发通知。
- 如果某个事件从未发送过“open incident”通知,那么后续事件将不会触发通知。
(提示:你可以找到一个文档中有详细的工作流程图)。
企业级的问题检测和事件管理需要灵活性和自动化。静音通知是我们今年将发布的一系列生命周期覆盖操作中的第一个,包括允许您安排静音。所有这些控件都可以通过我们的API和UI进行管理。
如何制定静音规则
使用New Relic的每个人都可以使用静音规则。
建立一个静音规则:
- 导航到New Relic的一>应用智能。
- 从左边的导航栏中选择静音的规则。
注意:由于New Relic One是一个跨账户体验,所以布线规则page列出了您所访问的所有帐户中存在的所有静音规则。然而,一个静音规则目前一次只能在一个帐户中操作。
- 建立你的规则:
- 点击添加一个规则。
- 选择一个名称和描述,并选择适当的帐户。
- 构建一个违例筛选器来设置条件,这些条件描述用于匹配违例对象属性的条件。
- 当您准备好激活该规则时,启用该规则。
你可以查看已静音的违规和事件在新遗迹警报。
创建复杂规则过滤器
在静音警报时,使用复杂的规则过滤器以获得更高的精度。例如,如果您的维护只涉及特定主机在一个集群中,服务一个主机上的一个子集,或如果你对数据中心进行更新或可用性区域分别影响大量的监控服务,复杂的规则过滤器可以帮助确保你只沉默的相关提醒。
通过组合匹配条件集来创建复杂的规则过滤器。过滤器可以使用这样的操作符或
或和
组合条件,大多数属性计算可以接受一个可能值的数组。
使用NerdGraph创建和管理静音规则
NerdGraph是一个交互式的、基于浏览器的IDE,用于运行GraphQL请求。使用NerdGraph,您可以创建和管理静音规则,并执行UI中提供的相同高级功能,包括为特定主机或产品创建静音规则,以及为特定帐户获取规则。亚博最新版直播发现多个文档中的NerdGraph API示例。
现在就试一试!
静音通知的能力是一种方式,我们给你更多的控制你的监控和帮助减少警报疲劳。
如果你准备好尝试一下,参加一个试验免费开始吧。