分区 - 局部索引与全局索引 - 《OceanBase v2.2.50 官方教程》

- 注意事项
使用限制

局部索引是针对单个分区上的数据创建的索引，因此局部索引的索引键值跟表中的数据是一一对应的关系，即局部索引上的一个分区一定对应到一个表分区，它们具有相同的分区规则，因此对于局部唯一索引而言，它只能保证分区内部的唯一性，而无法保证表数据的全局唯一性，如果要使用局部唯一索引去对数据唯一性做约束，那么局部唯一索引中必须包含表分区键，如下例所示：


Query OK, 0 rows affected (0.24 sec)
OceanBase(ADMIN@TEST)>create unique index uk on t2(b) local;
ERROR-00600: internal error code, arguments: -5261, A UNIQUE INDEX must include all columns in the table's partitioning function
OceanBase(ADMIN@TEST)>create unique index uk2 on t2(b, a) local;
Query OK, 0 rows affected (2.63 sec)

在 OceanBase 数据库中，局部索引同样支持分区裁剪，使用分区裁剪，但前提是查询条件中能够指定分区键，可以减少在查询过程中读取的分区个数，从而能够提高查询检索的效率，如下例所示：

如果在查询中，没有指定分区键，那么局部索引将无法进行分区裁剪，这时会扫描所有分区，增加额外的扫描代价，如下例所示：

explain select /*+index(t1 idx)*/ b from t1 where b=1;
| ====================================================
|ID|OPERATOR               |NAME    |EST. ROWS|COST|
----------------------------------------------------
|0 |EXCHANGE IN DISTR      |        |4950     |5308|
|1 | EXCHANGE OUT DISTR    |:EX10000|4950     |3083|
|2 |  PX PARTITION ITERATOR|        |4950     |3083|
====================================================
-------------------------------------
  0 - output([T1.B]), filter(nil)
  1 - output([T1.B]), filter(nil), dop=1
  2 - output([T1.B]), filter(nil)
  3 - output([T1.B]), filter(nil), 
      access([T1.B]), partitions(p[0-4])
 |

全局索引的创建规则是在索引属性中指定 GLOBAL 关键字，与局部索引相比，全局索引最大的特点是全局索引的分区规则跟表分区是相互独立的，全局索引允许指定自己的分区规则和分区个数，不一定需要跟表分区规则保持一致，如下例所示：

全局索引的分区键一定是索引键本身，因此在使用全局索引的过程中就会指定索引分区键的查询条件，可以针对索引的分区规则进行分区裁剪，在查询到索引键值后可以利用索引表中存储的主键信息计算出主表的分区位置，进而对主表也能进行快速的分区定位，避免扫描主表的所有分区，因此对于无法指定主表分区键的查询而言，全局索引在一定条件下能够加速查询的检索效率，如下例所示：

explain select /*+index(t1 gkey)*/ * from t1 where b=1;
| ==========================================
|ID|OPERATOR    |NAME    |EST. ROWS|COST |
------------------------------------------
|0 |TABLE LOOKUP|T1      |4950     |38645|
|1 | TABLE SCAN |T1(GKEY)|4950     |1115 |
==========================================
-------------------------------------
  0 - output([T1.A], [T1.B], [T1.C]), filter(nil), 
      partitions(p[0-4])
  1 - output([T1.A]), filter(nil), 
      access([T1.A]), partitions(p1)
 |

对于该查询，首先通过 where 条件中的 b=1 裁剪出全局索引的分区 p1，然后对全局索引进行 table scan 操作，得到对应的主键，利用 table lookup 算子对主表进行精确的分区扫描，避免扫描主表的所有分区。

注意事项

同局部索引相比，由于全局索引有独立的分区规则，因此索引表中一个分区的索引值可能对应着主表的多个分区内的数据，由于索引的分区规则和主表的分区规则不一定相同，因此在分布式环境中，索引数据和主表数据存储的位置也无法保证始终在一起，不可避免的会引入读写的 RPC 代价和分布式事务的代价。例如在查询中，当主表的分区和全局索引的分区不在同一个物理位置上，TABLE LOOKUP 算子中就包含一次 RPC 操作，到远端机器上去获取主表数据。因此全局索引相比局部索引有更高的维护代价，用户应当充分评估主表的分区规则，合理的选择分区键，尽量使更多的查询条件能够覆盖主表的分区键，从而尽可能的避免使用全局索引。

在分布式环境中，全局索引不可避免的会涉及到分布式事务和跨机的查询，因此全局索引依赖 GTS 维护全局的一致性快照，所以全局索引只能在 GTS 开启的时候使用。如果没有开启 GTS，则创建全局索引失败。如下例所示：

由于 OceanBase 数据库的表是索引组织表（IOT），对于分区表而言，为了保证给定主键的查询能很快定位到表所在的分区，所以分区键必须是主键的子集。如果这个表里面还含有局部分区唯一索引（Local Partitioned Unique Index），那么分区键就必须是所有分区唯一索引列（包括主键列）交集的子集，而对于全局分区唯一索引（Global Partitioned Unique Index）并没有这个限制。如下例所示：

obclient>create table test(pk int,c2 int ,c3 int, primary key(pk)) partition by hash(pk) partitions 5;
            Query OK, 0 rows affected (0.20 sec)
obclient>create unique index idx on test(c2) LOCAL;
            ERROR-00600: internal error code, arguments: -5261, A UNIQUE INDEX must include all columns in the table's partitioning function
obclient> create unique index idx on test(c2, pk) LOCAL;
           Query OK, 0 rows affected (5.34 sec)
obclient> drop index idx;
           Query OK, 0 rows affected (0.02 sec)
obclient> create unique index idx on test(c2) GLOBAL;