DM 分库分表合并场景

假设上游库结构如下：

实例 1

| Schema | Tables | |:———|:———| | user | information, log_north, log_bak | | store_01 | sale_01, sale_02 | | store_02 | sale_01, sale_02 |
实例 2

| Schema | Tables | |:———|:———| | user | information, log_east, log_bak | | store_01 | sale_01, sale_02 | | store_02 | sale_01, sale_02 |
| Schema | Tables | |:———|:———| | user | information, log_south, log_bak | | store_01 | sale_01, sale_02 | | store_02 | sale_01, sale_02 |

合并三个实例中的 .information 表至下游 TiDB 中的 user.information 表。
合并三个实例中的 user.log_{north|south|east} 表至下游TiDB中的 user.log_{north|south|east} 表。
合并三个实例中的 store_{01|02}.sale_{01|02} 表至下游TiDB中的 store.sale 表。
过滤掉三个实例的 user.log_{north|south|east} 表的所有删除操作。
过滤掉三个实例的 user.information 表的所有删除操作。
过滤掉三个实例的 store_{01|02}.sale_{01|02} 表的所有删除操作。
过滤掉三个实例的 user.log_bak 表。
因为 store_{01|02}.sale_{01|02} 表带有 bigint 型的自增主键，将其合并至 TiDB 时会引发冲突。您需要有方案修改相应自增主键以避免冲突。

假设同步后下游库结构如下：

要满足同步需求 #1 和 #2，配置 Table routing 规则如下：

要满足同步需求 #3，配置如下：


    ...
    store-route-rule:
      target-schema: "store"
    sale-route-rule:
      schema-pattern: "store_*"
      table-pattern: "sale_*"
      target-schema: "store"
      target-table:  "sale"

要满足同步需求 #4 和 #5，配置 Binlog event filter 规则如下：

要满足同步需求 #6，配置如下：

  filters:
    ...
    sale-filter-rule:
      schema-pattern: "store_*"
      table-pattern: "sale_*"
      events: ["truncate table", "drop table", "delete"]
      action: Ignore
    store-filter-rule:
      schema-pattern: "store_*"
      events: ["drop database"]

要满足同步需求 #7，配置 Black & white table lists 如下：

要满足同步需求 #8，配置如下：

    instance-1-sale:
      schema-pattern: "store_*"
      table-pattern: "sale_*"
      expression: "partition id"
      source-column: "id"
      target-column: "id"
      arguments: ["1", "store", "sale", "_"]
    instance-2-sale:
      schema-pattern: "store_*"
      table-pattern: "sale_*"
      expression: "partition id"
      source-column: "id"
      target-column: "id"
      arguments: ["2", "store", "sale", "_"]
    instance-3-sale:
      schema-pattern: "store_*"
      table-pattern: "sale_*"
      expression: "partition id"
      source-column: "id"
      target-column: "id"

同步任务的完整配置如下。详情请参阅 Data Migration 任务配置文件。