策略

教程 - 应用故障排除策略

一般策略:调试 DC/OS 上的应用程序部署

既然我们已经定义了 DC/OS 上调试应用程序的工具集,那么让我们考虑实际在应用程序调试方案中实施这些工具的逐步一般故障排除策略。一旦我们完成了一般战略,我们将考虑如何在[实践部分]应用此策略的一些具体方案。(/mesosphere/dcos/cn/2.1/tutorials/dcos-debug/scenarios/).

除了考虑方案特有的任何信息外,调试应用部署问题的合理方法是按以下顺序应用:

如果可能相关,则检查 或 Exhibitor/ZooKeeper Web 界面,以获取可能相关的调试信息。

第 2 步:检查任务日志

如果 Web 界面无法提供足够的信息,接下来请使用 DC/OS Web 界面或 CLI 检查 这有助于更好地了解应用程序可能发生的情况。如果问题与我们的应用程序没有部署有关(例如,任务状态继续无限期等待),请尝试查看’调试’页面. 这可能有助于更好地了解 Mesos 提供的资源。

第 4 步:检查代理程序日志

提供有关如何启动任务和任务环境的信息。请记住,在某些情况下,增加日志级别可能有助于获取更多可用的信息。

下一步是以交互方式查看容器内运行的任务. 如果任务仍在运行, 或 可以帮助启动交互式调试会话。如果应用程序基于 Docker 容器镜像,则使用 和 手动启动它也可以让您从正确的方向开始。

第 6 步:检查主节点日志

如上所述,通过使用 DC/OS Slack 或,[社区可能非常有用],非常有助于进一步执行调试。