当你正坐下来吃晚饭的时候,你收到了一个提示:你的账单服务有一个超过5分钟>的误码率为25%,违反阈值。现在怎么办呢?

找出违反警报的根本原因可能是困难和耗时的。

当触发警报违规时,这意味着被监视实体中的条件已经超过了您定义的阈值,但这并没有告诉您为什么会出现违规。警报违规应该显示关于系统状态的结构化、有组织的数据,并提供您需要的上下文和细节,这样您就知道从哪个方向开始挖掘。

如果您已经配置了事件的情报内,新遗迹应用智能在美国,你已经收到了更少、更有意义的提醒。现在,您可以通过自动警报分析更深入地研究刚刚收到的警报,该分析提供了关于每个警报违例的上下文和解释。您还可以获得关于实体的结构化视图和其他信息,以及当阈值越过时,实体周围发生了什么,以帮助您更快地进行故障排除。预警分析包括:

  • 违规的图表
  • 关于最近的活动,违规和实体的详细信息
  • 可以解释警报的关键属性建议
  • 显示相关异常的信号比较(如果您已经配置好了)主动检测)和这个特定实体的相关信号(如CPU、吞吐量等)在违反警报的同时发生

新遗迹应用情报中的警报分析

查看警报分析

要开始,您需要进行配置事件的情报在新遗迹应用智能。警报分析与主动检测以及事件情报,因此如果您想要附加上下文(如相关异常),您将希望配置主动检测。

在这种情况下,您需要从介绍中深入挖掘警报违规:计费服务使用an违反了静态警报阈值>的误码率为25%,至少持续5分钟。要查看警报分析,请导航到警报和人工智能>事件的情报>问题饲料

检查问题提要中的警告违例

检查问题提要中的警告违例

当你打开这个问题时,你会发现相关的活动;要深入分析警报的详细信息,请单击分析

告警分析分析链接

如果你熟悉主动检测分析异常页面,这看起来很熟悉,因为它的信息结构是相同的布局。在左上角,您将看到一个警告违规的图表。

分析一个警告

有关相关活动、违规行为和违规实体的详细信息可在右上方找到。

第二行表面上具有解释性关键属性这可能和警报有关。在本例中,使用我们的演示环境,我们定期地将错误脚本写入代码,您可以在这里看到。

比较信号部分显示与警报同时发生的相关异常,由主动探测提供动力。在我们的示例中,与fulfillment服务相关的上游异常与我们的警告冲突同时发生。

您可以看到这个特定实体的其他相关信号,例如CPU时间、吞吐量和web响应,它们为您提供了额外的上下文。使用信号旁边的火花线,您可以快速比较和对比多个信号在一段时间内发生的所有事情,并评估下一步需要进行哪些故障排除;例如,您是否需要更深入地研究外部服务、实体本身或基于阈值的查询?

比较信号来分析警报

通过为您配备有关警报的上下文、详细信息和结构化信息,New Relic应用智能帮助您更快地进行故障排除,并防止您在搜索答案时漫无目的地挖掘成堆的数据。

从应用智能开始,报名免费的New Relic账户

Annette Sheppard是New Relic的高级产品营销经理。她专注于AIOps,总是希望学习新东西。查看贴子

有兴趣为New Relic博客写作吗?亚搏体育登入网给我们发一份建议书!