我们正在升级FutureStack的注册,仅到4月30日。条款和条件适用。 现在注册

Nerdlog Roundup:切割MTTR并减少AIOPs的警报疲劳

3分钟阅读

如果你在Ops工作过一段时间,你就会看到服务失败希望他们出问题的时候就给你发了警报。有了New Relic的异常检测,你可以使用AIOps的力量来警告你,当一个服务看起来有问题的时候。

切割MTTR并主动检测异常

我们最新的Nerdlog关注的是New Relic应用智能主动检测。该功能通过标记令人担忧的模式,为事件添加上下文线索,并使用人工智能(AI)和机器学习(ML)来发现性能的变化可能预示着可能的问题。此功能并不替代警报,特别是在您提前配置了警报阈值以生成警报时。更确切地说,“主动检测”将对您没有预料到的问题发出警告。

高级产品经理Devin Cheevers让我们概述了您可以在哪里查看新的遗物应用智能的异常。开始看看应用情报异常馈送,现在所有用户都可以使用。

根本原因分析快速查找问题

我们知道很难理解为什么、什么时候、什么地方会在堆栈中出现问题。通过图表来寻找相关性可以让你远离对你和你的业务重要的事情。

现在,New Relic One将分析问题,并在警报和人工智能的问题页面上自动提出一个根本原因。您将看到一组事件,甚至可能需要调查的属性,而不是查看单个事件。

这些组件会取代人工操作工程师吗?从来没有,但使用根本原因分析将给这些人提供线索。属性调查查看所有属性,包括用户添加的属性,并给出对熟悉您的情况的人最有意义的指示器。

Devin和首席产品经理Nate Heinrich讨论了为什么这些功能很重要,以及增强的根本原因分析如何在凌晨2点寻呼机响起时节省我们所有的时间。检查文档了解更多关于如何获得实践。

使用拓扑相关性增加问题

最后,我们希望为您提供正确的上下文,以便您能够准确而有效地对问题进行优先排序。

拓扑(基于关系的)关联使用多个系统来发现异常可能是如何连接的,并提高事件关联的质量和发现它们的速度。之前,我们的相关引擎只针对两个类别:

  • 时间- 当发生两个异常时,在时间最近发生
  • 上下文-多个异常有非常相似的元数据(见我们的过去的事件关于如何配置关联引擎以连接元数据)

我们现在为相关性添加了第三个组件:

  • 拓扑结构- 两个实体是相同服务的一部分

属性的API可以配置拓扑连接nerdgraph API Explorer.,它可以让您告诉我们的关联引擎有关堆栈中存在的连接。

在Nate的段中,您将学习如何以及为什么相关性对减少警报噪音和疲劳来说是至关重要的,并看到他的演示如何通过API创建这些连接。

从构建人员那里获得关于最新特性和发布的每周更新。每次都加入Nerdlog讨论吧周四下午12点在推奇或者跟随有什么新鲜事。如果你不是New Relic的客户,立即注册您的免费帐户