使用 (g)v$sql_audit 进行问题排查方式如下:

    1. 通过 SQL Audit 查询抖动附近那段时间 RT 的 TOP N 请求,分析有异常的 SQL。

    • 查看 retry 次数是否很多(RETRY_CNT 字段),如果次数很多,则可能有锁冲突或切主等情况。

    • 查看获取执行计划时间(GET_PLAN_TIME 字段),如果时间很长,一般会出现 ,表示没有命中 plan cache。

    a. 查看是否有很长等待事件耗时。

    b. 分析逻辑读次数是否异常多(突然有大账户时可能会出现)。

    如果在 SQL Audit 中 RT 抖动的请求数据已被淘汰,则需要查看 OBServer 中抖动时间点是否有慢查询的 trace 日志,并分析对应的 trace 日志。