表设计 【关注】减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。 【建议】表的存储类型是表定义设计的第一步,客户业务类型是决定表的存储类型的主要因素,表存储类型的选择依据请参考。 表 1 表的存储类型及场景 选择分区方案当表中的数据量很大时,应当对表进行分区,一般需要遵循以下原则: 【建议】分区名称应当体现分区的数据特征。例如,关键字+区间特征。 【建议】将分区上边界的分区值定义为MAXVALUE,以防止可能出现的数据溢出。 表 2 表的分区方式及使用场景 分区方式描述Range表数据通过范围进行分区。表数据通过范围进行分区,超出范围的会自动根据间隔创建新的分区。List表数据通过指定列按照具体值进行分区。Hash表数据通过Hash散列方式进行分区。 典型的分区表定义如下: 更多的表分区语法信息参见。