本页面假设您有一个 Juju 部署的集群。

etcd 的 snapshot 操作能够让操作员给正在运行的集群数据建立快照,快照数据可用于复制、备份或者迁移到一个新的集群。

  • 参数 target:用于存储快照数据的目录。

etcd 能够通过 restore 操作从一个集群数据快照中恢复集群数据。这里有一个注意事项:集群必须只能有一个 member,并且需要指定一个具体的目录来恢复集群数据。所以最好能够使用 etcd charm 来部署一个新的集群,并且不要添加任何额外的单元。

  1. juju deploy etcd new-etcd

上面这段代码将会部署一个单独的 etcd 单元,称为 ‘new-etcd’。

  1. juju run-action etcd/0 restore target=/mnt/etcd-backups

当恢复操作完成后,您应评估一下集群的健康状态。如果集群运行良好,就可以按照您的需求来扩展应用程序规模。

  • 参数 skip-backup: 不要备份任何现有数据。

通过使用上述的 snapshot 和 restore 操作,就能很容易地迁移 etcd 集群。

结果:

  1. Action queued with id: b46d5d6f-5625-4320-8cda-b611c6ae580c

第二步: 检查操作状态,以便您能抓取快照并且验证 sum。您可以直接使用 copy.cmd 中的结果来下载您刚刚创建的快照数据,copy.cmd 中的结果可以直接复制/粘贴使用。

从节点上下载刚刚创建的快照数据并且验证 sha256 sum

  1. juju show-action-output b46d5d6f-5625-4320-8cda-b611c6ae580c

结果:

拷贝快照数据到本地磁盘并且检查 sha256sum。

  1. juju scp etcd/0:/home/ubuntu/etcd-snapshots/etcd-snapshot-2016-11-09-02.41.47.tar.gz .

第三步: 使用快照数据部署一个新的集群 leader:

  1. juju deploy etcd new-etcd --resource snapshot=./etcd-snapshot-2016-11-09-02.41.47.tar.gz

缺少 PKI 警告

如果您损坏了 leader - 通过 status 中紧接着 unit number 的 * 号来标识,那么所有的 TLS pki 将会丢失。对于需要请求和注册证书的 unit 将不会有 PKI 迁移。

警告: 如果该项配置缺失那么您将无法从外部访问集群,并且很可能会使得现有的 deployment 出现 x509 证书验证相关的奇怪问题,这些都会对服务端和客户端造成影响。

在一个扩展集群上恢复数据

在一个扩展集群上恢复数据将会导致集群损坏。Etcd 在 unit 启动时开始管理集群,并且将状态保存在 Etcd 中。在恢复快照数据时,etcd 将会初始化一个新的集群 ID,并且丢弃其它 peer 节点以保证快照数据的恢复。请严格遵照上述集群迁移中的恢复操作来进行操作。

译者:tianshapjq /