配置 GPU 节点

来源 1 浏览 482 扫码打印 2020-04-28 20:27:08

配置 GPU 节点

添加图形处理单元到长期运行的 DC/OS 服务

借助基于 GPU 的计划，您可以共享传统和机器学习工作负载的群集资源，还可以在这些群集内动态分配 GPU 资源并在需要时释放它们。您可以为有需要的工作负载预留 GPU 资源，或将这些启用了 GPU 的资源与基础架构的其余部分进行混合，以提高总体利用率。

在安装了启用 GPU 的 DC/OS 之后，您可以通过参数在应用定义中指定 GPU。

安装启用了 GPU 的 DC/OS

必须在 DC/OS 安装期间启用 GPU。按照以下说明，根据您的特定 DC/OS 部署方法启用 GPU。

使用安装 DC/OS 。以下是 GPU 特定的配置参数：

有关更多信息，请参阅配置参数文档和 Mesos 。

AWS DC/OS 高级模板系统要求。
复制到本地机器的 zen.sh 脚本。脚本和说明在。

运行 zen.sh 脚本以创建 Zen 模板依赖关系。这些依赖关系将用作在 CloudFormation 中创建堆栈的输入信息。

重要信息：在执行后续步骤之前，您必须先运行 zen.sh 脚本。

请根据此处说明，使用以下 GPU 专用配置创建具有高级 AWS 模板的群集。
在 创建堆栈 > 指定详情页面指定您的堆栈信息并单击 下一步。以下是 GPU 特定设置。
- PrivateAgentInstanceType——指定（例如，）。
- PublicAgentInstanceType——指定 AWS GPU 机器类型（例如， g2.2xlarge）。
在查看页面勾选确认框，然后单击创建。

注意：如果显示创建新堆栈页面，则要么是 AWS 仍在处理您的请求，要么是您查看的是其他分域。导航至正确的分域并刷新页面以查看您的堆栈。

本文档使用全库网构建