现在你可能听说过新的遗物基础设施,我们的很棒的新产品旨在“在您的动态基础设施上发光”和“减少MTTR”。

那些是有趣的短语,但我们中的许多人通过早期承诺并最终交付的解决方案,所以让我们直接进入新的遗物基础设施如何工作以及为什么这是值得的。亚博直播平台

使用AWS

具体来说,让我们专注于新的遗物架构如何工作亚马逊网络服务(AWS是您环境的一部分。我们会看:

  • 如何使用新的Relic基础设施在AWS上进行设置(代理安装和SaaS集成)
  • 新的遗物基础架构显示器计算(Amazon EC2)
  • 新的遗物基础设施如何监视卫星AWS服务(S3,Lambda-更多关于这个新集成的信息,请点击这里-还有很多)
  • 如何通过新的遗物架构主动监控您的环境(警报和仪表板)

如何在AWS上建立新的遗迹基础设施

让我们从无聊的部分开始(毕竟这是设置,它应该是无聊的)。我们的目标是让你的设置故事尽可能地熟悉和低影响。

代理安装

如果您已经熟悉新的遗物服务器,这个故事会听起来非常熟悉。新的遗物架构需要在主机上安装单个轻量级代理,使用APT-Get onDebian,百胜红色的帽子或者一个msi视窗- 我告诉过你这是基本的。初始设置自动配置唯一必要的字段(唯一标识您的帐户的许可证密钥)。代理具有您可以用于管理的关联配置文件可选的高级设置。由于安装流程是如此标准,因此很容易将其烘烤成一个厨师配方,木偶脚本,甚至进入基地ami.对于大规模部署,我们希望使这些过程更加容易。

SaaS Inteation.

新的遗物架构提供了一个Saa-to-SaaS集成,可以直接从AWS API直接从AWS API中安装(更介绍此案的内容)。这过程很简单:

  1. 创建一个我是角色,对一组特定的api具有只读权限
  2. 复制arn.在New Relic的界面中
  3. SipMai-Tais.虽然数据倒入

您可以从浏览器管理此整个过程,而无需登录单个计算机。

SaaS集成安装

对于SaaS集成的三步设置可以在60秒内完成,我们已经定时了。

New Relic Infrastructure如何监控计算

云 - 第一架构(甚至甚至在上提下的应用程序抬起和转移到公共或私有云)面临独特的监测挑战。他们让您在从根本上不同的方式考虑您的底层计算,而不是其上提原始的祖先。他们试图抽出各个服务器的概念,而是在一系列无名,短暂和可能的不可变实例中占总汇集。缩放和连续性问题这对于监控技术创造的是,许多企业生活在混合世界中,因此有用的解决方案必须同时考虑两个建筑。亚博直播平台

这正是我们想要做的。与新遗物一方面,我们忽略了两个环境的共同点,并提供了一个解决方案,旨在简单地为您提供所需的信息,而不是突出特征的任意差异。

按标签进行过滤和分组

一般来说,如果单个宿主死在云中......谁关心?在水平缩放的架构中,您只需旋转一个新实例(我会饶恕您的小狗与牛类比)。

在这个世界上,“宿主”的概念比过去重要得多。我们真正需要关心的是具有共同任务的主机组——这是我们AWS需求中长期未得到满足的部分。New Relic Infrastructure理解这一点,并提供了使用标签动态地分析和分组主机舰队的能力。当然,您可以查看所有主机或单个主机,但最佳位置肯定位于中间的某个位置。

无论您是想审核所有主机还是在US-West-1A中托管的30个T2微型实例上运行特定应用程序,那么新的遗物基础架构的UI体验是完全相同的。只需应用所需的过滤器,整个UI立即调整为仅包括该子集的数据。#bobsyouruncle。这些标签可以直接从框中出来的代理,从SaaS集成 - 是,那是对的,新的遗物架构可以自动提取EC2元数据并将其与您在配置文件中设置的自定义标签相关联。更好的是,这些过滤的视图可以随时保存和调整,以帮助您轻松地磨练您的关心。

一些可用标签的列表,用于过滤和面部基础架构主机的可用标签

一些可用标签的列表,用于过滤和面位的基础架构主机。

事件和指标属于一起

想象一下,您没有新的遗物架构,并且您的一组计算机徘徊在99%的CPU使用率约为99%。让我们慷慨,假设你有一些方法实际上被警告到除了在你的Twitter上肆虐的人,以便缓慢应用程序性能。你知道这可能是一个糟糕的标志,你应该尽量将使用量降到更普通的速度。所以你破解你的指关节,跳到你的时间机器和前往1980年,你在那里陷入每个主人并运行“顶部”。你在这一点上开始感觉漂亮的现代,因为你已经将问题追溯到主机上的特定过程(“foobar”)。你重新启动这个过程,......飙升立即再次发生!怎么办?(明显的答案:愤怒戒烟。)

现在,让我们在New Relic Infrastructure中运行同样的场景。首先,您将收到警报(它是在几秒内设置的),然后直接单击受影响主机的过滤视图。您可以看到CPU峰值和随时间变化的趋势,因此可以快速确定问题开始发生的大致时间。然后单击Events选项卡,获得在该时间窗口期间发生的所有更改的详细列表,包括会话登录、服务启动和停止、包安装等。您与做出更改的团队一起工作,获得修复,部署更改,然后继续您的生活。你甚至还能保住你的工作!

事件选项卡屏幕截图

看着活动选项卡,我们可以清楚地看到正常发生的事件。用户登录,安装了一个坏包,触发警报,然后删除包并注销。

在第一个情景中,您不知道为什么任何事情发生。这就是为什么New Relic Infrastructure引入了事件的概念来强调数值指标。可以把指标看作是什么正在发生时,过程输出为如何它正在发生,事件作为为什么它正在发生。

作为一个快速摘要,在云的世界中,获得获得充分理由的民主化。Devops作品,共享所有权工作,速度作品,但对于所有的好处,他们也可以增加人们不小心做一些愚蠢的机会。事件可帮助您立即确定这些时刻发生的时间。

黑盒内的可见性

我们已经让你的标签和过滤器过滤器,主,并最终更好地了解什么类型的东西你有在你的环境中运行,所以让我们跳到New Relic的基础设施的能力更进一步,告诉你到底什么是这些主机上运行。

想象一下,释放了一个名为“鳄梨”的新零点脆弱性(不再荒谬贵宾犬,heldbleed或shellshock)。知道您正在运行的主机并不能告诉您您是否容易受到攻击——而且手动登录到每个实例进行检查通常是不实际的。

这就是新遗迹基础设施的库存标签发挥作用的地方。基本上,它收集并搜索每个主机的大量“状态信息”。您可以在几秒钟内搜索包、配置和服务,轻松地审计漏洞。

例如:该漏洞仅影响旧版本的OpenSSL?只需在“搜索”框中键入“openssl”,并立即查看所有主机上运行的版本。木偶跑不做你的期望吗?验证脚本实际通过检查特定主机上的版本验证脚本。

简而言之,就是确切地看到什么在运行,什么时候改变,以及它在做什么。不需要担心快速开发和部署周期会使您无法密切关注安装在哪里的内容。

在所有515台主机上搜索“openssl”,可以得到在哪些主机上安装了哪些版本的详细信息,这样可以方便地进行审计。

New Relic Infrastructure如何监控卫星AWS服务(S3、Lambda等)

早些时候,我解释了AWS SaaS集成如何通过使用EC2元数据和指标来增强新的遗物基础架构的计算监控故事,以重音代理收集的数据。但让我们不要停止那里。AWS提供了丰富的服务,可以轻松访问核心应用要求,如存储,网络,队列,通知,负载平衡和内容分发。

这是一件幸事,因为没有人愿意管理没有任何差异化商业价值的东西。但这也是一种诅咒,因为不管理底层主机对它们的表现提供了有限的可见性。新的Relic基础设施旨在解决这个问题,通过使用相同的IAM用户提供在上面的设置和拉AWS服务(CloudFront, DynamoDB, EBS, ElastiCache, ELB, IAM, Kinesis, Lambda, RDS, S3, SNS, SQS, VPC)包括指标,事件,和更多的数据。

你可能会思考,“我很聪明,他们只是在控制台中使用的CloudWatch APIS”,你会部分正确。CloudWatch是我们用于收集数据的一种机制(尽管我们在核心度量上进行了提高,具有更强大的能力来转换数据和更长的保留期)。我们还收集其他数据,例如对这些服务的配置更改,并提供审核各个配置的能力。

真实世界的例子最好地理解这一点,因此请查看这些新的遗物架构屏幕截图:

(点击放大)

(点击放大)

(点击放大)

如何使用New Relic Infrastructure主动监控您的环境

指示板

如果你这样做,你就是一个士兵,所以我们会坚定地保持困惑。所有这些数据都存储在NRDB,支持的底层分析引擎New Relic的见解。这意味着您可以从洞察力和发出定制查询以其原始形式查看此数据的任何这些数据,以便为您的独特需求提供艺术小部件和仪表板(我们提供几个开箱即用的盒式仪表板,以帮助您启动和运行快速地)。拥有仪表板驱动器的家庭意识“正常的样子是什么?”即使在警报触发之前,也可以帮助表面异常行为。看看新的Relic基础设施文档为更多的细节。

基础架构数据以新的遗物洞察力的原始形式提供,并且可以像其他任何其他事件一样查询。

警报

如果您未在系统上设置警报,则您并没有真正监控。监控系统的整个点是减少他们失败的时间,最大的瓶颈几乎总是只是弄清楚存在问题。新的遗物架构允许用户设置针对定位所有主机或过滤的主机组的直接条件的警报。将它们设置为微不足道,并且它们对快速响应时间绝对至关重要。这里重要的是,无论您的主机是否属于本地,在云端,跨越两者,或在您的母亲的地下室,相同的政策,条件和过程都将同样适用于它们。

And for the grand finale, as an added bonus to all of you New Relic Servers veterans who have struggled with setting up meaningful alerts on your hosts when using a dynamically load-balanced environment like Amazon’s Elastic Beanstalk, it is my pleasure to announce that all Infrastructure alert conditions will automatically include any new hosts or targets that meet the filter criteria you set up. This will enable true “set it and forget it” alerts for your infrastructure, allowing you to rest easy as your topography of hosts changes around you!

警报可以针对所有或主机的子集,并且可以从UI中的任何图表中包含任何度量标准。

我希望这篇文章有助于让你的生活更轻松。留到新的遗物博客亚搏体育登入网对于未来分期付款“现实世界中的新遗物基础设施”系列。

Adam Larson是New Relic的高级技术营销工程师。查看贴子

对新遗物博客的写作有兴趣吗?亚搏体育登入网给我们一个推介!!