本文改编自一系列最佳实践指南,反映了新遗社区团队的帮助成千上万的客户开始使用新的遗物警报。还要查看我们的指南即可开始使用New Relic APMNew Relic的基础设施New Relic的浏览器New Relic的移动New Relic的人工合成物,新的遗物见解;并发现新遗迹社区团队的最新成果最佳实践指南

警报是一种不可或缺的实践,可以让您的团队在潜在的性能问题发生之前就知道它们。你不可能每时每刻都盯着你的网站新的遗物警报,你不必;当被监视的应用程序、主机或其他实体触发预定义的警报条件时,警报会自动通知您。

新的遗物警报可确保您的团队合适的成员获得他们尽快所需的警报。并且通过事件汇总和优先搜索的搜索条件等功能,警报有助于最大限度地减少风险“警戒疲劳”会在你的事件反应过程中导致错误和沟通不畅。

新的遗物警报提供快速和直观的访问,以提醒违规,有助于解决关键问题。

每一天,我们都听到客户的问题,从哪里和如何从New Relic警报获得最大的价值。下面的指南提供了我们最受欢迎和最有用的答案:对于组织开始使用New Relic警报以及New Relic平台的其他元素具有特殊价值的内幕提示和最佳实践。

(如果你对new Relic完全陌生,我们建议你从这里开始本入门教程和一系列短视频本文快速而全面地介绍了我们的产品系列、驱动它们的技术以及它们在现代软件开发中的地位。)亚博最新版直播

组织和优化新遗迹警报的提示

制定政策和条件

对于不熟悉New Relic警报术语及其组织方法的用户来说,创建有效的警报策略是一项挑战。幸运的是,有大量关于这些主题的有用信息可以帮助您入门。

配置警报涉及三个关键参数:开发一组正确的条件(您要对哪些内容发出警报)、阈值(将触发警报的值)和通知通道(将发送警报信息的地方)。警报策略是一组条件,所有这些条件都是针对特定实体(应用程序、主机、监视器等)设计的。违反是指您的条件被您预先设定的阈值所触发。

警报策略是一组条件,所有这些条件都是针对特定实体设计的。

这就是问题所在:虽然每个策略可以有多个条件,但通知是在策略范围内应用的。例如,当团队成员收到策略上的通知时,您不能“过滤”通知以通知其中一些收件人,但不能通知其他收件人。这意味着您需要将您的条件分组到适合于指定接收该策略通知的每个团队成员的策略中。

New Relic提供了两个非常有用的教程,涵盖了这些主题:一个专注于警报策略另一个警报通知渠道。我们还建议更多地学习定义警报条件配置警报策略并与之合作通知渠道在新的遗物警报中。

选择和使用事件首选项

警报中的事件偏好是一个策略的设置,指定为每个策略接收的警报通知频率。默认情况下,如果有一个开放事件 (例如,一个条件被触发,打开一个需要注意的违规),那么该政策中任何条件的任何新的违规都将被卷起成为初始事件。这意味着任何额外的违规行为都不会触发通知;您的团队必须关闭open事件,并且必须在警报发送任何其他策略通知之前发生新的违规。

此默认行为存在于一个充分原因:在某些情况下,策略可能会触发大量冗余或无关的通知。这些可以分散或甚至压倒一支球队 - 一种方式,即“警戒疲劳”可以侵蚀你处理合法性能问题的能力。但它也可能导致团队缺少重要或紧急通知。

事件偏好解决了这一困境;它允许你在选择的基础上,使用默认的(基于策略的)频率来创建新的事件,或者根据涉及特定条件的违规或特定条件和特定实体(应用程序、主机、监视器等)的特定组合来创建事件。每一个选项都将产生更多的通知,让您决定在何处平衡新问题的意识和保持通知为可管理级别的需要。

最佳实践方法包括为警报中的事件偏好设置一个覆盖整个账户的标准实践,帮助确保您在需要通知时获得所需通知。警报事件首选项是一致警报通知的关键(一个新的Relic升级贴子)引导您详细讨论如何使用事件首选项、如何设置警报策略以及相关主题。

设置通知频道

如上所述,通知渠道规定了警报通知的发送地点。您可以配置通知通道,以使用特定的电子邮件地址自动发送到帐户上的特定用户,或者选择与流行消息传递服务的多个预先配置集成之一。如果这些都不能完成任务,你还可以利用警报中的webhook向任何你能想到的地方发送通知。

New Relic警报中的Webhooks支持强大的自定义通知功能。

请记住,通知通道是根据策略设置的;最好的方法是确定需要同一个人或团队关注的条件,并将这些条件分组到一个单一的政策中。

如果您想了解有关这些主题的更多信息(一个非常好的想法!),请从概述开始如何创建、使用和管理通知通道在新的遗物警报中。我们还建议审查涵盖的新遗物教程警报事件生命周期,以及一个新的Relic升级说明您需要了解的一切,了解使用Webhooks要创建自定义通知。

了解您在新的遗物警报中所看到的内容

学习警报语言

当您使用New Relic警报时,您将遇到许多新的和不熟悉的术语。大多数都是很直观的,但是保持新文物警报词汇就在你手边,直到你积累了一些使用它们的经验。

探索一个事件

New Relic Alerts提供了一个事件视图功能,可以将策略中发生的所有违规行为组合在一起,并以时间轴的形式显示它们。探索这个时间线可以让你更好地理解是什么触发了事件;后续问题在何处以及如何出现,以及所有这些问题之间的关系如何通知解决过程。

New Relic警报还允许团队成员承认事件——表明他们正在识别和解决任何潜在的问题。通常,当事件得到解决时,警报会自动关闭相关的违规;例如,当触发违规的阈值条件相反时,警报会关闭违规。但是,也可以在必要时手动关闭违规并解决警报条件。

新的遗物大学提供了一种新的遗物警报,最佳实践,提醒网络研讨会,深入潜入报警事件生命周期。您还可能想审核支持文档,以外承认警报事件以及如何手动关闭违规行为

对警报采取行动

事件背景

应用程序的响应时间变长有无数的原因——例如,罪魁祸首可能是缓慢的数据库调用和缓慢的外部服务。通常情况下,追溯事件发生的起点是一个非常累人和耗时的过程——而且不保证你会得到得到明确答案所需的数据。

新的Relic警报事件上下文特性为团队提供了一个快速、可靠和强大的替代方法。事件上下文在应用程序或其他实体的性能触发警报阈值时对其进行分析。如果警报检测到异常行为that correlates to an alert violation, it will report that correlation in the incidents UI and, if appropriate, include a link to the relevant New Relic product chart—putting data at a team’s fingertips that might have taken many hours of work to track down before.

将警报数据发送到洞察力

默认情况下,Insights无法提供警报事件。但是,通过在警报中使用灵活的Webhook通知通道,可以将警报通知发送到Insights Insert API以跟踪这些警报作为自定义事件。

发送警报数据到解开启各种其他可能性,用于分析此数据并从中提取有用信息。例如,一支团队可以创建回答问题的仪表板,“最常违反哪个策略?”或者“五个最近的警报违规是什么?”

了解更多关于将警报数据发送到新的遗物洞察力使用webhooks和Insights insert API。

建立一个基线警报

申请“一种尺寸适合所有”思考应用程序性能并不总是有用的甚至可取。例如,业务应用程序可能会在营业时间内看到更高的吞吐量,这意味着资源耗尽的潜力更高,而不是周末。鉴于这些变体,在24/7的基础上为应用程序设置单个警报阈值并不总是一个可行的选择。

基线警报通过学习识别应用程序性能数据中的模式来解决此挑战。最初,此过程需要大约两周的性能数据。但是,在很长一段时间内,基线警报继续分析性能,并建立对给定时间跨度有意义的基线。This allows you to set conditions that trigger when any of an application’s standard alerting metrics (error rate, response time, etc.) deviate from a baseline that is appropriate for that time—and not simply based on a single, and sometimes inappropriate, threshold.

了解有关配置和使用的更多信息基线条件在新的遗物警报中。

准备好了解更多内容了吗?

寻找更多的新Relic提醒、最佳实践和技巧?检查警报级别提升类别在这里。

另外,请记住,当您准备炫耀新技能时,请务必采取新的遗物警报最佳实践测验并获得您的能力徽章!

查看贴子

有兴趣为New Relic博客写作吗?亚搏体育登入网给我们发一份建议书!!