TiDB-Binlog 部署方案

TiDB-Binlog 支持以下功能场景:

  • 数据同步: 同步 TiDB 集群数据到其他数据库
  • 实时备份和恢复: 备份 TiDB 集群数据,同时可以用于 TiDB 集群故障时恢复

首先介绍 TiDB-Binlog 的整体架构。

TiDB-Binlog 集群主要分为两个组件:

Pump

Pump 是一个守护进程,在每个 TiDB 的主机上后台运行。他的主要功能是实时记录 TiDB 产生的 Binlog 并顺序写入磁盘文件

Drainer

Drainer 从各个 Pump 节点收集 Binlog,并按照在 TiDB 中事务的提交顺序转化为指定数据库兼容的 SQL 语句,最后同步到目的数据库或者写到顺序文件

  • CentOS 7+

注意

  • 需要为一个 TiDB 集群中的每台 TiDB server 部署一个 pump,目前 TiDB server 只支持以 unix socket 方式的输出 binlog。
  • 手动部署时, 启动优先级为: PUMP > TiDB ; 停止优先级为 TiDB > PUMP
  1. ![TiDB pump 模块部署结构](http://static.bookstack.cn/projects/pingcap-docs-cn/media/tidb-pump-deployment.png)
  • 在已有的 TiDB 集群中启动 drainer,一般需要全量备份 并且获取 savepoint,然后导入全量备份,最后启动 drainer 从 savepoint 开始同步;

    为了保证数据的完整性,在 pump 运行 10 分钟左右后按顺序进行下面的操作

    • 以 gen-savepoint model 运行 drainer 生成 drainer savepint 文件,bin/drainer -gen-savepoint --data-dir= ${drainer_savepoint_dir} --pd-urls=${pd_urls}
    • 全量备份,例如 mydumper 备份 tidb
    • 全量导入备份到目标系统
    • 设置 savepoint 文件路径,然后启动 drainer, bin/drainer --config=conf/drainer.toml --data-dir=${drainer_savepoint_dir}
  • drainer 输出的 pb, 需要在配置文件设置下面的参数

    1. [syncer]
    2. db-type = "pb"
    3. disable-dispatch = true
    4. [syncer.to]
    5. dir = "/path/pb-dir"

使用 tidb-ansible 部署 PUMP (推荐)

  • 搭建全新的 TiDB Cluster,启动顺序 pd-server -> tikv-server -> pump -> tidb-server -> drainer

    • 修改 tidb-ansible inventory.ini 文件
      • enable_binlog = True
    • 执行 ansible-playbook deploy.yml
    • 执行 ansible-playbook start.yml
      • drainer 目前需要手动部署
  • 对已有的 TiDB Cluster 部署 binlog

    • 修改 tidb-ansible inventory.ini 文件
    • 执行 ansible-playbook rolling_update.yml —tags=tidb
      • drainer 目前需要手动部署

使用 Binary 部署 PUMP

  1. PUMP 命令行参数说明

  1. PUMP 配置文件

    1. # pump Configuration.
    2. # pump 提供服务的 rpc 地址(默认 "127.0.0.1:8250")
    3. addr = "127.0.0.1:8250"
    4. # pump 对外提供服务的 rpc 地址(默认 "127.0.0.1:8250")
    5. advertise-addr = ""
    6. # binlog 最大保留天数 (默认 7), 设置为 0 可永久保存
    7. gc = 7
    8. # pump 数据存储位置路径
    9. data-dir = "data.pump"
    10. # pump 向 pd 发送心跳间隔 (单位 秒)
    11. heartbeat-interval = 3
    12. # pd 集群节点的地址 (默认 "http://127.0.0.1:2379")
    13. pd-urls = "http://127.0.0.1:2379"
    14. # unix socket 模式服务监听地址 (默认 unix:///tmp/pump.sock)
    15. socket = "unix:///tmp/pump.sock"
    1. 启动示例
    1. ./bin/pump -config pump.toml

使用 Binary 部署 Drainer

  1. Drainer 配置文件

    1. # drainer Configuration.
    2. # drainer 提供服务的地址(默认 "127.0.0.1:8249")
    3. addr = "127.0.0.1:8249"
    4. # 向 pd 查询在线 pump 的时间间隔 (默认 10,单位 秒)
    5. detect-interval = 10
    6. # drainer 数据存储位置路径 (默认 "data.drainer")
    7. data-dir = "data.drainer"
    8. # pd 集群节点的地址 (默认 "http://127.0.0.1:2379")
    9. pd-urls = "http://127.0.0.1:2379"
    10. # log 文件路径
    11. log-file = "drainer.log"
    12. # syncer Configuration.
    13. [syncer]
    14. ## 不支持对 ignore schemas 的 table 进行 rename DDL 操作
    15. ignore-schemas = "INFORMATION_SCHEMA,PERFORMANCE_SCHEMA,mysql"
    16. # 输出到下游数据库一个事务的 sql 数量 (default 1)
    17. txn-batch = 1
    18. # 同步下游的并发数,该值设置越高同步的吞吐性能越好 (default 1)
    19. worker-count = 1
    20. # 是否禁用拆分单个 binlog 的 sqls 的功能,如果设置为 true,则按照每个 binlog
    21. # 顺序依次还原成单个事务进行同步( 下游服务类型为 mysql, 该项设置为 False )
    22. disable-dispatch = false
    23. # drainer 下游服务类型 (默认为 mysql)
    24. db-type = "mysql"
    25. # replicate-do-db priority over replicate-do-table if have same db name
    26. # and we support regex expression ,
    27. # 以 '~' 开始声明使用正则表达式
    28. #replicate-do-db = ["~^b.*","s1"]
    29. #[[syncer.replicate-do-table]]
    30. #db-name ="test"
    31. #tbl-name = "log"
    32. #[[syncer.replicate-do-table]]
    33. #db-name ="test"
    34. #tbl-name = "~^a.*"
    35. # db-type 设置为 mysql 时,下游数据库服务器参数
    36. [syncer.to]
    37. host = "127.0.0.1"
    38. user = "root"
    39. password = ""
    40. port = 3306
    41. # db-type 设置为 pb 时,存放 binlog 文件的目录
    42. # [syncer.to]
    43. # dir = "data.drainer"
  1. 启动示例

    1. ./bin/drainer -config drainer.toml

这部分主要对 TiDB-Binlog 的状态、性能做监控,通过 Prometheus + Grafana 展现 metrics 数据,

使用 ansible 部署的 pump 服务,已经在启动参数设置 metrics 。

drainer 启动时可以设置 --metrics-addr--metrics-interval 两个参数,其中 metrics-addr 设为 Push Gateway 的地址,metrics-interval 为 push 的频率,单位为秒,默认值为15

  • 点击 Grafana Logo -> 点击 Dashboards -> 点击 Import -> 选择需要的 dashboard 配置文件上传 -> 选择对应的 data source