OceanBase 数据库支持的 MERGE 算子包括 MERGE 和 MULTI PARTITION MERGE。

    MERGE 算子用于合并数据表单个分区中的数据。

    如下例所示,Q1 查询将 src_tbl 表中的数据行合并到 t1 表中,对于 src_tbl 中的每一条数据行按照如下方式进行合并:

    • 当 t1 中存在满足 条件的数据行:

    • 如果满足 src_tbl.c2 > '100',则执行更新操作,将 t1.c2 的值置为 src_tbl.c2 的值(目标表中的每一行只会更新一次)。

    • 如果不满足 src_tbl.c2 > '100',则不执行更新操作。

    • 当 t1 中不存在满足 t1.c1 = src_tbl.c1 条件的数据行:

    • 如果满足 src_tbl.c1 > 10,则执行插入操作,向 t1 中插入 (src_tbl.c1,src_tbl.c2)

    • 如果不满足 src_tbl.c1 > 10,则不指定插入操作。

    其中,OUTER JOIN 是合并功能实现时依赖的一次联接操作,使用 MERGE 算子时,一定会在 source_tabletarget_table 上做一次外联接,目的是为了区分哪些行是匹配的,哪些是不匹配的。

    执行计划展示中的 outputs & filters 详细列出了 MERGE 算子的输出信息如下:

    MULTI PARTITION MERGE

    MULTI PARTITION MERGE 算子用于合并数据表多个分区中的数据。

    如下例所示,Q2 查询将 src_tbl 表中的数据行合并到分区表 t2 表中,对于 src_tbl 中的每一条数据行按照如下方式进行合并:

    • 当 t2 中存在满足 t2.c1 = src_tbl.c1 条件的数据行:

    • 执行更新操作,将 t2.c2 的值置为 substr(src_tbl.c2, 1, 5) 的值(目标表中的每一行只会更新一次)。

    • 更新完成后,如果满足 t2.c2 > '80000' ,则删除对应的数据行。

    • 当 t2 中不存在满足 t2.c1 = src_tbl.c1 条件的数据行,执行插入操作,向 t2 中插入 (src_tbl.c1, src_tbl.c2)

    1. Q2:
    2. obclient>EXPLAIN MERGE INTO t2 USING SRC_TBL ON (t2.c1 = src_tbl.c1)
    3. WHEN MATCHED THEN
    4. DELETE WHERE t2.c2 > '80000'
    5. WHEN NOT MATCHED THEN
    6. *************************** 1. row ***************************
    7. Query Plan:
    8. ============================================================
    9. |ID|OPERATOR |NAME |EST. ROWS|COST |
    10. --------------------------------------------------------------
    11. |0 |MULTI PARTITION MERGE | |100000 |100000 |
    12. |1 | PX COORDINATOR | |100000 |956685 |
    13. |2 | EXCHANGE OUT DISTR |:EX10001|100000 |899889 |
    14. |3 | MERGE OUTER JOIN | |100000 |899889 |
    15. |4 | EXCHANGE IN DISTR | |100000 |90258 |
    16. |5 | EXCHANGE OUT DISTR (PKEY)|:EX10000|100000 |61860 |
    17. |6 | TABLE SCAN |SRC_TBL |100000 |61860 |
    18. |7 | SORT | |1000000 |5447108|
    19. |8 | PX PARTITION ITERATOR | |1000000 |618524 |
    20. |9 | TABLE SCAN |T2 |1000000 |618524 |
    21. Outputs & filters:
    22. -------------------------------------
    23. 0 - output([column_conv(DECIMAL,PS:(38,0),NOT NULL,SRC_TBL.C1)], [column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SRC_TBL.C2)]), filter(nil),
    24. columns([{T2: ({T2: (T2.C1, T2.C2)})}]), partitions(p[0-9]),
    25. update([T2.C2=column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SUBSTR(SRC_TBL.C2, 1, 5))]),
    26. match_conds([T2.C1 = SRC_TBL.C1]), insert_conds(nil),
    27. update_conds(nil), delete_conds([T2.C2 > '80000'])
    28. 1 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil)
    29. 2 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil), dop=1
    30. 3 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil),
    31. equal_conds([T2.C1 = SRC_TBL.C1]), other_conds(nil)
    32. 4 - output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil)
    33. 5 - (#keys=1, [SRC_TBL.C1]), output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil), is_single, dop=1
    34. 6 - output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil),
    35. access([SRC_TBL.C1], [SRC_TBL.C2]), partitions(p0)
    36. 7 - output([T2.C1], [T2.C2]), filter(nil), sort_keys([T2.C1, ASC]), local merge sort
    37. 8 - output([T2.C1], [T2.C2]), filter(nil)