数据库内核月报－ 2015/01 - TokuDB·特性分析· Optimize Table - 《数据库内核月报》

现象大概是:

用户有一个MyISAM的表test_table:

转成TokuDB引擎后表大小为92M左右:

执行”OPTIMIZE TABLE test_table”:

继续执行:

基本稳定在这个大小。

主索引从47M–>63M–>79M，执行”OPTIMIZE TABLE”后为什么会越来越大？

这得从TokuDB的索引文件分配方式说起，当内存中的脏页需要写到磁盘时，TokuDB优先在文件末尾分配空间并写入，而不是“覆写”原块，原来的块暂时成了“碎片”。

这样问题就来了，索引文件岂不是越来越大？No, TokuDB会把这些“碎片”在checkpoint时加入到回收列表，以供后面的写操作使用，看似79M的文件其实还可以装不少数据呢！

1) 在执行这个语句的时候，TokuDB到底在做什么呢？

在做toku_ft_flush_some_child，把内节点的缓冲区(message buffer)数据刷到最底层的叶节点。

2) 在TokuDB里，OPTIMIZE TABLE有用吗？

作用非常小，不建议使用，TokuDB是一个”No Fragmentation”的引擎。