我们正在升级FutureStack的注册,仅到4月30日。条款和条件适用。 现在注册

引入新Relic的动态基线警报

5分钟读

在New Relic,我们都在利用先进的算法、可靠的统计数据和机器学习,为客户提供更准确、更可行的见解,以了解他们日益复杂的环境。动态基线警报是我们在这一领域的最新进展,我们非常兴奋地展示了一个预览它和其他新功能FutureStack16在旧金山。

需求是明确的

在过去的10年里,软件系统已经进化得异常动态。可以存活数年的裸金属系统变成了可以存活数月的虚拟机,然后虚拟机变成了只能存活几分钟的容器。现在,一些IT公司正在用无服务器的堆栈替换容器,这些堆栈的生命周期可以以毫秒为单位来衡量。曾经拥有大量单片应用程序的公司现在通常拥有成百上千的应用程序和微服务。过去每年、然后每月、然后每周、然后每天进行的部署,现在可以以分钟来衡量。单个数据中心正在被合并多个数据中心和许多云提供商的企业基础设施所取代。

这种演变允许组织更快地移动并降低风险,但它也带来了新的挑战。您必须监视的“事物”的数量、新“事物”出现的速度以及它们被接触和更改(部署)的速度意味着操作团队需要新的、更强大的工具来帮助他们理解和管理这些动态系统。New Relic的动态基线警报是支持行业发展方向的重要一步。

baselines-tweet-small

动态基线预测未来

对于系统,就像对于人一样,过去的行为往往是未来表现的最佳预测器。所以我们看了几个星期的历史数据来评估帮助预测度量数据行为的三个因素。所有这些因素都包括在基线计算中:

  1. 最近的数据:我们最近看到了什么价值?
  2. 趋势:值随时间变化的方向和速度是多少?
  3. 季节性:在过去类似的时间,它的价值是多少?

如果我们权衡这三个行为并结合使用它们,我们就可以预测下一个数据点。基于该预测,我们可以创建动态警报阈值,查看期望值和实际值之间的差异,这正是我们使用dynamic Baseline Alerts所要做的。

何时使用动态基线警报

静态警报在很多情况下都是有用的,但是我们认为很多时候动态基线警报会特别有用。

第一个是帮助您管理您不太了解的系统。(基本上,当你没有足够的数据并且没有时间等待的时候。)这可能是由于开发和运营之间的划分(开发者将其抛到一边,而运营则负责保持其运行),也可能是你还没有时间完全理解的一个新系统。你需要让它活下去,但你还不知道什么是正常。

动态基线警报对于具有明显季节性的动态性能概要的系统也很有用。在这些情况下,动态基线将比静态基线更准确地识别问题。考虑下面的例子:

baseline-graphic-1

静态阈值对于一周中繁忙的日子可能会产生假告警,但是对于正常繁忙的日子可能会错过异常。使用动态阈值设置基线有助于解释这些情况。

新遗迹动态基线警报的好处

动态基线警报有几个方面让我们特别兴奋:

  1. 自信的报警阈值:动态基线警报包括一个图表预览功能,可以显示您的历史行为,以及在这些情况下会发送哪些警报。实际上,您可以一眼看到发生了什么,从而帮助您调整警报阈值并选择正确的敏感级别。
  2. 细微粒度和精密计算:我们以分钟为单位计算基线。你是否有一份每小时前五分钟都很紧张的工作?通过混合使用高级统计和算法来生成动态阈值来检测应用程序和服务中的微小性能异常,新的Relic Dynamic Baseline警报可以解释这一点。
  3. 快速警报配置:动态基线警报节省了为未知应用程序设置新警报的时间。基线是根据手头的数据计算的,即使它只有几个小时或几天。与等待季节性基线(可能需要几周或几个月才能显示)不同,您可以立即看到预览,而Dynamic Baseline Alerts被设计为在获得更多数据时自动调整自身。

动态基线警报即将到来!

现在我们已经在FutureStack上有限地发布了动态基线警报,我们计划分阶段向客户推出该功能。我们期待得到这个到我们的新遗物客户的手中,并听到它如何为你工作!

(有关更多信息,请参见关于动态基线警报的新Relic文档)。