我们正在用swag升级FutureStack注册,直到4月30日。条款和条件适用。 现在注册

环境中的复杂性:集装箱化和管弦乐监控Kubernetes[视频]

8分钟阅读

New Relic在语境中的复杂性视频系列旨在让您清楚地了解如何在现代软件环境中使用New Relic来解决分布式技术的复杂性。在第二节课中,我们会教你怎么做监控Kubernetes使用New Relic,您可以快速排除故障并探索Kubernetes集群的不同层。

要完全跟踪和理解您的Kubernetes环境的性能,您必须重新考虑您的监控策略考虑到在如此复杂的分布式环境中引入的新层。此外,您需要主动监视节点、部署、pod、容器、前端和后端应用程序、分布式跟踪以及Kubernetes集群中运行的主机的数据和元数据。


在Kubernetes环境中有许多层需要监视。

您可以在这里阅读这些步骤,然后观看整个过程具体视频嵌在柱子的末端。

部署新的Relic基础设施代理

要开始使用New Relic监视Kubernetes,您需要部署和配置新遗迹基础设施代理Kubernetes集群。截至2019年4月,我们支持Kubernetes 1.6和更高版本,以及像亚马逊Kubernetes弹性集装箱服务,Kubernetes发动机(GKE),Azure Kubernetes服务(AKS),Openshift。部署特工几分钟后,你就能进入关键指标比如容器的CPU使用、内存使用、容器重启等等。

(请按照New Relic用户界面的说明或参阅我们的Kubernetes集成文档有关安装和配置的更多信息。)

使用Kubernetes集成仪表板的操作视图

部署代理后,您就可以访问Kubernetes集成仪表板:


默认的Kubernetes集成指示板

除了提供使用的资源数量、每个集群的名称空间、每个pod的名称空间和容器重启等操作数据的可见性外,仪表板还显示了集群中对象之间的关系:


默认的Kubernetes集成指示板允许深入查看集群。

默认指示板是监视集群的一个很好的起点,但是要理解集群中真正发生了什么,您需要使用Kubernetes集群资源管理器

使用Kubernetes集群浏览器进行故障排除

使用cluster explorer,您可以观察整个Kubernetes环境的性能和依赖项。默认视图的示例显示了带有同心圆的9个节点的集群:


Kubernetes集群浏览器中的默认视图。

探察器中的每个圆圈代表一个感兴趣的区域。外环显示了集群中的节点。每个节点表示都有一个表示CPU、内存使用率和存储量的指标。向内移动时,六边形表示与选定节点相关联的pods的分布和状态。例如,如果pod是红色的,则表示已经突破了警报阈值;即使它在运行,也可能有健康问题。最后,中心的豆荚需要高度关注;这些豆荚要么没有运行,要么Kubernetes无法安排它们。

单击一个pod以访问关于pod中任何依赖项的详细信息,以及查看在pod中运行的容器和应用程序的特定性能指标。

在下面的例子中,pod的详细信息显示,由于无效的图像名,pod正在等待,容器正在等待:


Kubernetes cluster explorer可以提供集群中任何pod的详细信息和性能指标。

最后,使用cluster explorer的高级过滤以多种方式划分和查看集群。根据对您和角色重要的内容,选择您关心的名称空间、部署或标签,以获得更准确的视图。您还可以查看集群中所有节点、pod和容器的完整列表,并在进行故障排除时根据状态筛选该列表。


使用Kubernetes集群资源管理器中的过滤选项进行高级故障排除。

监控Kubernetes中的应用的性能指标

在Kubernetes集群浏览器中,您还可以看到关于集群所托管的任何应用程序的重要细节,包括对跟踪响应时间、吞吐量、错误率和违规情况的指标的访问。运行应用程序的任何podNew Relic APM在pod详细信息窗格中将有链接到APM概述页面分布式跟踪页面


在Kubernetes cluster explorer的pod-details窗格中查看重要的APM或分布式跟踪数据。

这些链接帮助您将基础设施和应用程序关联起来,这样您就可以排除问题,而不管您是从哪一边处理问题的。

观看视频并开始

通过使用Kubernetes集成和集群浏览器,New Relic提供了一种主动的方法来监视Kubernetes环境。整合是可用的所有新遗迹基础设施客户在Pro级别。

额外的资源: