集群及应用监控

    针对kubernetes集群和应用的监控,相较于传统的虚拟机和物理机的监控有很多不同,因此对于传统监控需要有很多改造的地方,需要关注以下三个方面:

    • Kubernetes集群本身的监控,主要是kubernetes的各个组件
    • kubernetes集群中Pod的监控,Pod的CPU、内存、网络、磁盘等监控
    • 集群内部应用的监控,针对应用本身的监控

    跟物理机器和虚拟机的监控不同,在kubernetes集群中的监控复杂度更高一些,因为多了一个虚拟化层,当然这个跟直接监控docker容器又不一样,kubernetes在docker之上又抽象了一层service的概念。

    在kubernetes中的监控需要考虑到这几个方面:

    • 应该给Pod打上哪些label,这些label将成为监控的metrics。
    • 当应用的Pod漂移了之后怎么办?因为要考虑到Pod的生命周期比虚拟机和物理机短的多,如何持续监控应用的状态?
    • 更多的监控项,kubernetes本身、容器、应用等。
    • 监控指标的来源,是通过heapster收集后汇聚还是直接从每台主机的docker上取?

    容器的命名规则

    首先我们需要清楚使用cAdvisor收集的数据的格式和字段信息。

    当我们通过cAdvisor获取到了容器的信息后,例如访问获取的json结果中的某个容器包含如下字段:

    这些信息其实都是kubernetes创建容器时给docker container打的Labels,使用docker inspect $conainer_name命令同样可以看到上述信息。

    你是否想过这些label跟容器的名字有什么关系?当你在node节点上执行docker ps看到的容器名字又对应哪个应用的Pod呢?

    在kubernetes代码中pkg/kubelet/dockertools/docker.go中的BuildDockerName方法定义了容器的名称规范。

    这段容器名称定义代码如下:

    1. // Creates a name which can be reversed to identify both full pod name and container name.
    2. // This function returns stable name, unique name and a unique id.
    3. // Although rand.Uint32() is not really unique, but it's enough for us because error will
    4. // only occur when instances of the same container in the same pod have the same UID. The
    5. // chance is really slim.
    6. func BuildDockerName(dockerName KubeletContainerName, container *v1.Container) (string, string, string) {
    7. containerName := dockerName.ContainerName + "." + strconv.FormatUint(kubecontainer.HashContainerLegacy(container), 16)
    8. stableName := fmt.Sprintf("%s_%s_%s_%s",
    9. containerNamePrefix,
    10. containerName,
    11. dockerName.PodFullName,
    12. dockerName.PodUID)
    13. UID := fmt.Sprintf("%08x", rand.Uint32())
    14. return stableName, fmt.Sprintf("%s_%s", stableName, UID), UID
    15. }
    16. // Unpacks a container name, returning the pod full name and container name we would have used to
    17. // construct the docker name. If we are unable to parse the name, an error is returned.
    18. func ParseDockerName(name string) (dockerName *KubeletContainerName, hash uint64, err error) {
    19. // For some reason docker appears to be appending '/' to names.
    20. name = strings.TrimPrefix(name, "/")
    21. parts := strings.Split(name, "_")
    22. if len(parts) == 0 || parts[0] != containerNamePrefix {
    23. return nil, 0, err
    24. }
    25. if len(parts) < 6 {
    26. // We have at least 5 fields. We may have more in the future.
    27. // Anything with less fields than this is not something we can
    28. // manage.
    29. glog.Warningf("found a container with the %q prefix, but too few fields (%d): %q", containerNamePrefix, len(parts), name)
    30. err = fmt.Errorf("Docker container name %q has less parts than expected %v", name, parts)
    31. return nil, 0, err
    32. }
    33. nameParts := strings.Split(parts[1], ".")
    34. containerName := nameParts[0]
    35. if len(nameParts) > 1 {
    36. hash, err = strconv.ParseUint(nameParts[1], 16, 32)
    37. if err != nil {
    38. glog.Warningf("invalid container hash %q in container %q", nameParts[1], name)
    39. }
    40. }
    41. podFullName := parts[2] + "_" + parts[3]
    42. podUID := types.UID(parts[4])
    43. return &KubeletContainerName{podFullName, podUID, containerName}, hash, nil
    44. }

    下面的是四个基本字段。

    所有kubernetes启动的容器的containerNamePrefix都是k8s。

    Kubernetes启动的docker容器的容器名称规范,下面以官方示例guestbook为例,Deployment 名为 frontend中启动的名为php-redis的docker容器的副本书为3。

    Deployment frontend的配置如下:

    1. apiVersion: extensions/v1beta1
    2. kind: Deployment
    3. name: frontend
    4. template:
    5. metadata:
    6. labels:
    7. app: guestbook
    8. tier: frontend
    9. spec:
    10. containers:
    11. - name: php-redis
    12. image: harbor-001.jimmysong.io/library/gb-frontend:v4
    13. resources:
    14. requests:
    15. cpu: 100m
    16. memory: 100Mi
    17. env:
    18. - name: GET_HOSTS_FROM
    19. value: dns
    20. ports:
    21. - containerPort: 80

    我们选取三个实例中的一个运行php-redis的docker容器。

    • containerNamePrefix:k8s
    • containerName:php-redis
    • podFullName:frontend-2337258262-154p7
    • computeHash:154p7
    • deploymentName:frontend
    • replicaSetName:frontend-2337258262
    • namespace:default
    • podUID:d8a2e2dd-3617-11e7-a4b0-ecf4bbe5d414

    kubernetes容器命名规则解析,见下图所示。

    kubernetes的容器命名规则示意图

    是kubernetes官方提供的监控方案,我们在前面的章节中已经讲解了如何部署和使用heapster,见安装Heapster插件

    但是Grafana显示的指标只根据Namespace和Pod两层来分类,实在有些单薄,我们希望通过应用的label增加service这一层分类。架构图如下:

    应用监控

    Kubernetes中应用的监控架构如图:

    应用监控架构图

    这种方式有以下几个要点:

    • 访问kubernetes API获取应用Pod的IP和端口
    • Pod labels作为监控metric的tag
    • 直接访问应用的Pod的IP和端口获取应用监控数据
    • metrics发送到OWL中存储和展示

    对于复杂的应用编排和依赖关系,我们希望能够有清晰的图标一览应用状态和拓扑关系,因此我们用到了Weaveworks开源的。

    安装scope

    我们在kubernetes集群上使用standalone方式安装,详情参考Installing Weave Scope

    使用文件安装scope,该服务安装在kube-system namespace下。

    1. $ kubectl apply -f scope.yaml

    创建一个新的Ingress:kube-system.yaml,配置如下:

    执行kubectl apply -f kube-system.yaml后在你的主机上的/etc/hosts文件中添加一条记录:

    1. 172.20.0.119 scope.weave.io

    在浏览器中访问scope.weave.io就可以访问到scope了,详见边缘节点配置

    如上图所示,scope可以监控kubernetes集群中的一系列资源的状态、资源使用情况、应用拓扑、scale、还可以直接通过浏览器进入容器内部调试等。

    参考