例如,用户可以监控集群和节点的服务组件状态、CPU 利用率、内存使用率和磁盘 I/O、网卡流量等物理层级的基础指标,还可以监控平台的企业空间、容器组 (Pod) 和容器的 CPU 使用量、内存使用量等指标,以及应用资源用量、资源用量趋势,监控数据支持选择节点、企业空间或项目按具体指标进行排行。KubeSphere 监控还提供逐级钻取能力,用户可以很方便地查看某个服务组件下工作负载中的 Pod 和容器监控状况,帮助快速定位故障。
KubeSphere 的监控中心包括 和 应用资源监控 两大监控维度。通常,只有平台管理员 (cluster-admin) 或在该平台角色的权限列表中勾选了 查看监控管理 的用户才有权限在控制台查看监控中心,详见 和 应用资源监控。
KubeSphere 对资源的监控从两条线提供多维度的监控指标,即
从上图中不难发现,KubeSphere 平台的监控指标和 IaaS 层相似,有我们常见的 CPU、内存、磁盘和网络等四个方面的使用量和使用率,还包括 Kubernetes 集群的 ETCD、API Server 和 kube-scheduler 的监控。
另外 KubeSphere 也提供主机的 inode 监控,Kubernetes 对镜像和日志都有回收机制,但没有对 inode 的回收或清理机制,有可能发生 inode 已经用光,但是硬盘还未存满的情况,此时已无法在硬盘上创建新文件,可能会造成整个集群中某个节点无法创建工作负载。