举个简单的例子,trx1和trx2同时等待一条记录锁,按照传统的方式,谁先进入等待队列,谁将优先获得锁。但如果同时有2个事务等待trx1,10个事务等待trx2,那么从全局来看收益最大的显然是让trx2获取到行锁。

当被挂起等待的事务数超过32个时,会自动切换到新的调度方式

相关资料先列一下:

论文一: A Top-Down Approach to Achieving Performance Predictability in Database Systems

论文二:

Release Note:

WL#10793: InnoDB: Use CATS for scheduling lock release under high load

主要代码变更见这个commit: fb056f442a96114c74d291302e8c4406c8c8e1af, 或者commit log搜WL#10793关键字

这个功能的核心有两个,一个是如何去维护每个事务的权重,在代码里以trx_t::age表示,第二个是基于新的调度算法,如何去选择被调度的事务。

PS: 本文涉及函数基于MySQL8.0.3

  • 当前线程不是复制线程
  • 并发等待线程数超过32(LOCK_VATS_THRESHOLD)

关于第二点,增加了lock_sys_t::n_waiting来追踪,在函数lock_wait_suspend_thread里递增,在lock_wait_table_release_slot里递减

事务age的接口函数为lock_update_age 及lock_update_trx_age,在将新的事务所加入hash,或者完成一次grant操作后,都需要对事务age进行更新

先来看看函数lock_update_age是如何计算的:

  • 针对每个事务的age更新,是一个递归函数,函数接口为lock_update_trx_age
    • 将新的age值赋予给trx_t
    • 如果当前事务也处于等待状态的话,则找到其等待的锁被哪些事务持有,并将age值累加上去。
  • 通过如上的递归流程,确保了在等待向量图中每个事务的权重被正确的更新掉

当释放掉一个锁时,需要检查是否有别的等待的锁可以获得锁,VATS调度的函数入口为lock_rec_dequeue_from_page –> lock_grant_vats

相比传统的grant方式,lock_grant_vats函数的逻辑要复杂许多:

waiting队列会做一个排序,排序规则从comment里拷贝的,如下:

  • 然后依次遍历waiting队列,如果无需等待(lock_rec_has_to_wait_vats), 则赋予记录锁,并将其移到哈希队列的头部
  • 无论是当前释放的锁移除出锁队列,还是任一等待的事务获得了锁,都需要去更新锁等待图相关联事务权重