一、关于 KubeOperator
KubeOperator 使用 Terraform 在 IaaS 平台上自动创建主机(用户也可以自行准备主机,比如物理机或者虚机),通过 Ansible 完成自动化部署和变更操作,支持 Kubernetes 集群 从 Day 0 规划,到 Day 1 部署,到 Day 2 运营的全生命周期管理。
- CI / CD 应用场景:GitLab、Jenkins、Harbor、Sonarqube、Argo CD 等;
- GPU / AI 应用场景:Tensorflow、PyTorch 等;
- 数据库应用场景:MySQL、Redis 等;
KubeOperator 的整体架构如下图所示:
- 简单易用:提供可视化的 Web UI,极大降低 K8s 部署和管理门槛,内置 Webkubectl;
- 离线部署:持续更新包括 Kubernetes 及常用组件的离线包;
- 按需创建:调用云平台 API,一键快速创建和部署 Kubernetes 集群;
- 按需伸缩:快速伸缩 Kubernetes 集群,优化资源使用效率;
- 自我修复:通过重建故障节点确保集群可用性;
- 全栈监控:提供从Pod、Node到集群的事件、监控、告警、和日志方案;
- Multi-AZ 支持:将 Master 节点分布在不同的故障域上确保集群高可用;
- 应用商店:内置 应用商店,快速部署和管理常见应用;
- GPU 支持:支持 GPU 节点,助力运行深度学习等应用;