性能调优
在 KubeVela 的性能测试中,KubeVela 团队验证了在各种不同规模的场景下 KubeVela 控制器的运维能力。并给出了以下的推荐配置:
性能瓶颈出现时一般可能会有以下一些不同的表现:
- 新创建的应用能够获取到,关联资源无法获取,且应用渲染本身没有问题 ( 在应用的信息内没有出现渲染错误 )。检查 apiserver 内是否存在大量排队请求,这种场景有可能是由于分发的下属资源,如 Deployment 请求到了 apiserver,但由于先前的资源在 apiserver 处排队导致新请求无法及时处理。
- KubeVela 控制器本身由于内存不足频繁崩溃,可以通过给控制器提高内存量解决。
参数 | 默认值 | 说明 |
---|---|---|
optimize-cached-gvks | 需要额外缓存的资源类型。例如 —optimize-cached-gvks=Deployment.v1.apps,Job.v1.batch 。如果在你的系统中 KubeVela 管控的资源类型主要集中在特定几种上,你可以将这些类型的资源加入缓存中来提高性能。注意:该优化会增加 KubeVela 控制器的内存使用量。 | |
optimize-resource-tracker-list-op | true | 通过增加索引优化 ResourceTracker 的 List 操作。略微增加内存使用量。 |
optimize-controller-reconcile-loop-reduction | false | 通过压缩 KubeVela 的应用转移状态来减少调谐次数。具体来讲,在 patch finalizer 以及 workflow finished 之后,调谐会继续进行而不是立刻结束。开启该优化会在不必要的场景下偶尔重跑工作流。如果你并不需要确保工作流不会重复执行,可以选择开启该优化。 |
optimize-mark-with-prob | 0.1 | 通过减少 ResourceTracker 对于 keepLegacyResource 模式下过期资源的扫描次数来优化 ResourceTracker 的资源回收。如果你不需要使用 keepLegacyResource 能力,该优化不会有任何影响。 |
optimize-disable-component-revision | false | 通过关闭 ComponentRevision 减少存储和计算的开销。如果你不需要应用组件灰度更新的能力,可以选择开启该选项。 |
optimize-disable-application-revision | false | 通过关闭 ApplicationRevision 减少存储和计算的开销。如果你不需要应用回滚能力,可以选择开启该选项。 |
optimize-disable-workflow-recorder | false | 通过关闭工作流的历史记录来减少存储开销。如果你不需要使用 VelaUX 来查看工作流的历史记录,可以选择开启该选项。 |
optimize-enable-in-memory-workflow-context | false | 将工作流的状态基存储在内存而不是 ConfigMap 中,降低存取延时。副作用是如果 KubeVela 控制器重启,尚未结束的工作流会重跑。如果你并不需要确保工作流不会重复执行,可以选择开启该优化。 |
optimize-disable-resource-apply-double-check | false | 通过禁用资源创建后的二次确认来优化工作流。如果你使用的工作负载没有配置健康检查,同时不需要二次确认其创建,可以选择开启该优化。 |
optimize-enable-resource-tracker-delete-only-trigger | true | 通过关闭 ResourceTracker 删除事件之外的事件接受来优化系统性能。 |
更多细节可以参考