我们正在用swag升级FutureStack注册,直到4月30日。条款和条件适用。 现在注册

宣布新的Relic AI通用可用性:为繁忙的DevOps和SRE团队提供AIOps和更快的事件响应

11分钟阅读

经过家伙Fighel

随着软件系统变得更加复杂,对质量和可靠性的需求增加,Devops,SRE和网络运营中心(NOC)团队可以发现自己不断淹没了泛滥的信息。在嘈杂的警报之间,在多个工具中分布的信号以及数千个“未知未知”,很难快速确定和解决事件的根本原因,更不用说地检测并积极响应问题。故障排除和事件响应因来自多个工具的警报涌入而进一步复杂化,这些警报可以为您的团队产生分心和反应疲劳。

我们已经看到了这些问题,并了解维护复杂大规模系统的斗争。这就是为什么我们很高兴宣布一般可用性新的遗物应用智能(AI),这是一个AIOps解决方案,可以帮助随叫随到团队更快地检测、诊断和响应事件。《New Relic AI》是为了让你的团队走出被动的“救火”模式,回到创造、挑战和令人兴奋的构建伟大软件的工作中去。

快速连接,更快到价值:在您已经使用的工具中会见您

如果您的DevOps、SRE或on-call团队的任务是维护复杂的基础设施,那么您可以依赖多种工具来检测和响应事件。有一些很好的工具可以在你的整个技术堆栈中观察系统;当事故发生时通知你的工具;追踪进度及跟进行动的工具;以及与其他团队成员沟通的工具。对于在压力下待命的团队来说减少平均分辨率时间(MTTR)此外,这种不断增长的工具列表可能会出现问题:事件,事件和操作数据是碎片,静音或冗余,使得诊断和解决事件所需的信息难以实现。

AIOps平台承诺通过一个集中的、智能的事件信息提要来解决这些问题,该提要将在单个窗格中显示故障排除和响应问题所需的一切。然而,解锁这个值可能需要大量的时间承诺和工作流转换,潜在地花费您的团队数百小时在集成、配置、培训和入职任务上。

新的遗物AI方法是完全不同的:它结合了具有最小配置要求的智能系统的值。新的遗物ai是源头和数据不可知论,与...集成PagerDuty,New Relic的警报,分裂,普罗米修斯,格拉纳纳,亚马逊CloudWatch.以及通过我们的其他数据源休息API.。新的遗物AI在不需要数周的情况下开箱即用船上并研究您的数据,并且它会随着时间的推移而学习,自动聚集,关联和优先考虑您的事件数据,以帮助您的团队减少警报疲劳。这种简化的增强信息可在您的团队现有的事件管理工具中获得,如PageRduty,ServiceNow,opsgenie.维多利乌开所以你不需要重新设计你应对突发事件的方式。

进一步逐步,我们与您已经使用的通知和协作工具集成并提供关键洞察,如自动异常检测到您的松弛频道或您选择的其他通知渠道。关于您的生产系统的重要信息现在可以在您的指尖访问,无需更改您的随叫随到的工作流程。

整个Devops周期的更多智能

我们不是缩小我们对事件响应过程的一个特定方面的方法,而是加强过程之间的每个阶段之间的关系,以创建更强大的解决方案。只关注更快的检测,更快的理解,更快的响应,或更快的后续行动是不够的;您需要一个像你最好的SRES一样思考的工具 - 从系统的角度来看。

积极检测异常

事件响应过程的第一步是检测潜在的问题。新的遗物AI提供了自动异常检测,您可以在几分钟内配置,只需点击几下即可。


在New Relic AI中查看有关你的异常的关键信息。

它很容易告诉系统您想要监视异常的应用程序和服务,并将实时故障警告发送到要接收通知的工具,如松弛。对于许多呼叫团队通过Slack进行问题时,这一曲面关于您的团队已经完成工作的工具中的潜在问题的关键上下文。您还可以设置Webhooks,以从新的遗物AI主动检测发送故障警告,以定制您选择的定制通知渠道。


新的遗物AI可以实现与现有协作工具的无缝集成。

“New Relic AI的主动探测能力非常容易设置和使用。没有任何代理配置更改或部署需要,”说高级网站可靠性工程师杰弗里·海恩斯表示健康。“特别是,它帮助我的团队实现了速度,敏捷性,并提供了运营能见度,最终帮助我们将事故减少,将机器学习和分析集成到运营中并提高整体客户体验。”

减少警报噪声和疲劳

待命团队熟悉由低优先级、不相关或摇摆不定的问题触发的嘈杂警报。这些可能会导致警惕性疲劳,引起分心,并增加了关键信号被忽视的可能性。New Relic AI的事件智能使用行业标准知识的基线,然后从您的数据和团队的反馈中学习,智能地抑制您不关心的警报,并将相关事件关联起来,无需过多的配置、培训或入职。已经使用New Relic人工智能系统的用户报告称,他们发现该系统的噪音自动降低了80%以上,同时还提供了更精简、更实用的警报。


新的遗物AI使用基线行业知识来减少不相关警报的噪音。

“今天,它最大的问题它是努力最多的斗争是让大量的事件警报噪音变得有意义,影响团队专注于构建完美软件的能力。有了New Relic AI,我们的团队就能清楚地了解特定问题是如何影响业务服务的,从而能够快速识别最关键的业务问题并对其进行优先排序。通过这次发射,我们期待着利用目标情报的力量,并最终优化成本。”Peter Hammond,全球技术运营负责人,晨星,Inc。

透明、信任和控制

你和你的团队需要相信,相关性不会丢失关键信号,这种信任来自透明度。我们认为AIOps工具不应该是一个黑匣子,这就是为什么New Relic AI清楚地告诉你问题是如何关联的,这样你就可以相信不会错过任何信号。使用人工智能和机器学习(ML), New Relic人工智能可以根据你的历史数据提出相关关联。


New Relic AI展示了问题是如何和为什么相关的,并寻求反馈以持续改进。

您还可以通过讲述新的遗物ai来构建您自己的决策并通知相关引擎,这些数据可以比较和相关的内容。设置频率和持续时间阈值,并根据需要选择外禁止相似算法,以微调相关引擎。


新的遗物AI使您能够轻松地通知事件如何与您自己的决策逻辑相关联。

诊断并更快地响应

一旦发现问题并且您的团队分页调查和故障排除过程开始。更接近根本原因并确定解决的步骤通常会占发生问题的大多数时间及其修复之间的大多数时间。新的遗物ai通过为现有问题提供有用的上下文来加速这个过程,包括基于的分类“四个金色信号”(延迟,流量,错误和饱和度)以及有关任何相关组件的信息,因此您可以更快地达到可能的根源并隔离问题的来源。新的遗物ai甚至根据您的数据建议响应者,并提供了轻松确定您向您的团队发送问题的灵活性;例如,它很容易将所有与特定应用程序名称的所有事件设置为仅使用新遗物AI中的Pathways功能通知该团队的专用PageRduty Service。

就像一个新的团队成员一样,new Relic AI变得更加智能,并在研究数据时构建有关团队基础设施的特定系统知识。您的团队可以提供关于问题相关性的质量、自动浮现的信息和建议的响应者的反馈,帮助系统随着时间的推移进行调整并交付更有针对性的相关见解。


新的遗物AI提供关于相关事件的背景和丰富,以帮助您诊断和更快地响应。

对现有的事件管理工作流程没有更改

新的遗物AI符合您在现有事件管理工作流程和工具中提供的相关性,丰富的事件和上下文,因此您无需更改您对事件的响应方式。Simply connect your existing tools as data sources and destinations via New Relic’s guided configuration interface or our REST API and webhooks, and the solution takes care of the rest, ingesting incident data from your toolchain, enriching it with context, providing smart suggestions and guidance, and delivering relevant insights about incidents to your tools of choice.


新的遗物AI表面与PageRduty等事件管理工具相关联事故和浓缩。

为更完美的软件提供更智能的工具

新的遗物的使命是仪器,衡量和改进互联网,以帮助客户创建更多完美的软件,体验和企业。In order to do this, we believe it’s critical to embrace solutions that are easy to connect and configure, work with the tools teams already use, create value throughout the entire observability process, and learn from data patterns and user feedback to get smarter over time. New Relic AI is one more step in this journey. It’s already making a difference for busy DevOps, SRE, and NOC teams, and we’re excited to see the value it can bring to your teams, too.

起步资源

为了了解New Relic AI如何帮助你和你的团队,请求演示