通过 Rancher 您可以使用先进的开源监控解决方案来监控集群节点,Kubernetes 组件和软件部署的状态和过程。

根据官方文档介绍,Prometheus 提供了时序型数据,这种时序型数据是指:一个带有时间戳(时刻数值)的数值流,其中任何一个数值都属于同一个指标和同一组标签(维度)。

因此您可以配置 Prometheus 去收集集群级别或者项目级别的监控数据。本章节将介绍如何启用对集群的监控。有关对项目的监控,可以浏览。

Prometheus 让您可以查看 Rancher 及其纳管的各个 Kubernetes 集群的指标。通过时间戳,您可以使用 Rancher UI 或者 Grafana(这是一种与分析工具一起部署的分析查看平台)通过易于阅读的图表和可视化仪表盘查询这些指标。

在集群和项目之间的多租户管理也是支持的。

通过 Prometheus,您可以在 Rancher 上在集群级别和进行监控。对于每个启用了监控的集群和项目,Rancher 都会部署一个 Prometheus 服务。

  • 集群监控可让您查看 Kubernetes 集群的运行状况。Prometheus 从下面的集群组件中收集指标,您可以在图表中查看这些指标。

作为或集群所有者,您可以通过配置来监控您的 Kubernetes 集群。

  1. 全局页面中导航到您想要配置的集群。
  2. 在导航栏中下拉工具,选择监控
  3. 查看,以确保您有足够的资源用于 Prometheus 及其相关组件。根据需要,配置 Prometheus 选项
  4. 点击启动

结果:将部署 Prometheus 服务以及两个监控。这两个监控应用商店应用是和,它们会被添加到集群的项目中。当这两个应用处于后,您可以通过 Rancher 集群仪表盘开始查看或直接从 Grafana中查看。

启用集群监控时,需要确保您的工作节点和 Prometheus Pod 有足够的资源。下表提供了关于资源消耗方面的指南。在较大型的部署中,强烈建议将监控组件(Prometheus 及其相关组件)调度到集群中的专用节点上。

该表是 Prometheus Pod 的资源消耗,它基于集群中所有节点的数量。节点数包括工作节点,控制平面和 etcd 节点。总磁盘空间分配应通过在集群级别设置的来估算。启用集群级别监控时,应该根据您的情况,调整 CPU 和内存的限制值及预留值。

集群监控中其他的 Pod 资源的要求:

其他 Pods 的资源消耗