TiDB 3.0 升级操作指南

    • 从 2.0.6 之前的版本升级到 3.0 之前,需要确认集群中是否存在正在运行中的 DDL 操作,特别是耗时的 Add Index 操作,等 DDL 操作完成后再执行升级操作
    • 2.1 及之后版本启用了并行 DDL,早于 2.0.1 版本的集群,无法滚动升级到 3.0,可以选择下面两种方案:
      • 停机升级,直接从早于 2.0.1 的 TiDB 版本升级到 3.0
      • 先滚动升级到 2.0.1 或者之后的 2.0.x 版本,再滚动升级到 3.0 版本

    在中控机器上安装 Ansible 及其依赖

    TiDB-Ansible release-3.0 版本依赖 2.5.14 Ansible 版本(ansible=2.5.14),另依赖 Python 模块:jinja2>=2.9.6jmespath>=0.9.0。为方便管理依赖,新版本使用 pip 安装 Ansible 及其依赖,可参照 进行安装。离线环境参照在中控机器上离线安装 Ansible 及其依赖

    安装完成后,可通过以下命令查看版本:

    tidb 用户登录中控机并进入 /home/tidb 目录,备份 TiDB 2.0 版本或 TiDB 2.1 版本的 tidb-ansible 文件夹:

    1. $ mv tidb-ansible tidb-ansible-bak
    1. $ git clone -b $tag https://github.com/pingcap/tidb-ansible.git

    编辑 inventory.ini 文件和配置文件

    tidb 用户登录中控机并进入 /home/tidb/tidb-ansible 目录。

    编辑 inventory.ini 文件,IP 信息参照备份文件 /home/tidb/tidb-ansible-bak/inventory.ini

    以下变量配置,需要重点确认,变量含义可参考 inventory.ini 变量调整

    1. 请确认 配置的是普通用户。为统一权限管理,不再支持使用 root 用户远程安装。默认配置中使用 tidb 用户作为 SSH 远程用户及程序运行用户。

      可参考自动配置主机间互信。

    2. process_supervision 变量请与之前版本保持一致,默认推荐使用 systemd

      1. # process supervision, [systemd, supervise]

      如需变更,可参考 如何调整进程监管方式从 supervise 到 systemd,先使用备份 /home/tidb/tidb-ansible-bak/ 分支变更进程监管方式再升级。

    编辑 TiDB 集群组件配置文件

    TiKV 配置中 end-point-concurrency 变更为 high-concurrencynormal-concurrencylow-concurrency 三个参数:

    1. readpool:
    2. coprocessor:
    3. # Notice: if CPU_NUM > 8, default thread pool size for coprocessors
    4. # will be set to CPU_NUM * 0.8.
    5. # normal-concurrency: 8
    6. # low-concurrency: 8

    单机多 TiKV 实例情况下,需要修改这三个参数,推荐设置:实例数 * 参数值 = CPU 核数 * 0.8

    确认 tidb-ansible/inventory.ini 文件中 tidb_version = v3.0.0,然后执行以下命令下载 TiDB 3.0 binary 到中控机。

    滚动升级 TiDB 集群组件

    如果 process_supervision 变量使用默认的 systemd 参数,则通过 excessive_rolling_update.yml 滚动升级 TiDB 集群。

    1. $ ansible-playbook excessive_rolling_update.yml

    如果 process_supervision 变量使用 supervise 参数,则通过 rolling_update.yml 滚动升级 TiDB 集群。