统计信息

来源 1 浏览 696 扫码打印 2019-11-29 07:42:25

统计信息

在SequoiaDB中有两种统计信息，集合的统计信息和索引的统计信息。

集合的统计信息存放在数据节点的SYSSTAT.SYSCOLLECTIONSTAT集合中，具体的字段如下：

例子：

索引的统计信息存放在数据节点的SYSSTAT.SYSINDEXSTAT集合中，具体的字段如下：

字段名	数据类型	默认值	必须	说明
CollectionSpace	String		是	统计的Collection所在Collection Space的名称
Collection	String		是	统计的Collection的名称（不带Collection Space名字）
CreateTime	NumberLong	0	是	统计收集的时间戳
Index	String		是	统计Index的名称
KeyPattern	BSONObj		是	统计索引的字段定义，例如：{a:1, b:-1}
SampleRecords	NumberLong	0	是	统计收集时抽样的文档个数
TotalRecords	NumberLong	10	是	统计收集时的文档个数
IndexPages	NumberInt	1	是	统计收集时索引的页个数
IndexLevels	NumberInt	1	是	统计收集时索引的层数
IsUnique	BOOL	FALSE	是	Index是否唯一索引
MCV	Object	undefined	否	频繁数值集合(Most Common Values) 如：MCV: { Values: [ {a:1,b:1}, {a:2, b:2}, … ], Frac: [ 1000, 1000, … ] }
MCV.Values	Array		是(如有MCV)	频繁数值的值
MCV.Frac	Array		是(如有MCV)	频繁数值的比例，每个值的取值 0 ~ 10000，最终比例为 (Frac / 10000) * 100%

统计信息可以用于查询优化器评估索引的选择率，参考基于代价的访问计划评估。

如果字段上建立的是唯一索引，则选择率为：
如果相等比较的值落入频繁数值集合中，假设命中下标为 i，则选择率为：selectivity = MCV.Frac[i]
如果相等比较的值没有落入频繁数值集合中，则选择率为：selectivity = ( 1 - sum( MCV.Frac ) ) * 0.005

范围比较的选择率估算

示例

统计信息中的字段 "val" 的频繁数值集合的内容为：

{ val : { $et : 1 } } 命中频繁数值集合，因此其选择率估算为：
{ val : { $et : 10 } } 没有命中频繁数值集合，因此其选择率估算为：selectivity = 0.1 * 0.005 = 0.0005

请参考。

本文档使用全库网构建