Tensorflow

    • 用于管理 Jupyter 的 JupyterHub 服务
    • 用于管理训练任务的 Tensorflow Training Controller
    • 用于模型服务的 TF Serving 容器

    部署之前需要确保

    • 一套部署好的 Kubernetes 集群或者 Minikube,并配置好 kubectl 命令行工具
    • 安装 ksonnet 0.8.0 以上版本

    对于开启 RBAC 的 Kubernetes 集群,首先要创建管理员角色绑定:

    1. cd my-kubeflow
    2. ks registry add kubeflow github.com/google/kubeflow/tree/master/kubeflow
    3. ks pkg install kubeflow/core
    4. ks pkg install kubeflow/tf-serving
    5. ks pkg install kubeflow/tf-job
    6. ks generate core kubeflow-core --name=kubeflow-core

    如果有多个 Kubernetes 集群,也可以切换到其他其集群中部署,如

    稍等一会,就可以看到 tf-hub-lb 服务的公网IP,也就是 JupyterHub 的访问地址

    1. kubectl get svc tf-hub-lb

    JupyterHub 默认可以用任意用户名和密码登录。登陆后,可以使用自定义镜像来启动 Notebook Server,比如使用

    • gcr.io/kubeflow/tensorflow-notebook-cpu

    使用 CPU:

    1. ks generate tf-cnn cnn --name=cnn
    1. MODEL_COMPONENT=serveInception
    2. MODEL_NAME=inception
    3. MODEL_PATH=gs://cloud-ml-dev_jlewi/tmp/inception
    4. ks generate tf-serving ${MODEL_COMPONENT} --name=${MODEL_NAME} --namespace=default --model_path=${MODEL_PATH}
    5. ks apply gke -c ${MODEL_COMPONENT}