1. 给定连续随机变量 的概率密度函数 三、MCMC 采样 - 图1 ,则 在区间 三、MCMC 采样 - 图2 中的概率可以计算为:

      如果函数 三、MCMC 采样 - 图3, 则可以计算 的期望:三、MCMC 采样 - 图4

      • 如果 不是一个单变量,而是一个高维的多元变量 三、MCMC 采样 - 图5 ,且服从一个非常复杂的分布,则对于上式的求积分非常困难。为此,MCMC先构造出服从 分布的独立同分布随机变量 三、MCMC 采样 - 图6 , 再得到 的无偏估计:

        三、MCMC 采样 - 图7

      • 如果概率密度函数 也很复杂,则构造服从 三、MCMC 采样 - 图8 分布的独立同分布随机变量也很困难。MCMC 方法就是通过构造平稳分布为 的马尔可夫链来产生样本。

    1. MCMC 算法的基本思想是:先设法构造一条马尔可夫链,使其收敛到平稳分布恰好为 三、MCMC 采样 - 图9 。然后通过这条马尔可夫链来产生符合 分布的样本。最后通过这些样本来进行估计。

      这里马尔可夫链的构造至关重要,不同的构造方法将产生不同的算法。Metropolis-Hastings:MH算法是MCMC的重要代表。

    2. 假设已经提供了一条马尔可夫链,其转移矩阵为 三、MCMC 采样 - 图10 。目标是另一个马尔科夫链,使转移矩阵为 、平稳分布是 三、MCMC 采样 - 图11

      通常 ,即 三、MCMC 采样 - 图12 并不满足细致平稳条件不成立。但是可以改造已有的马尔可夫链,使得细致平稳条件成立。

      引入一个函数 ,使其满足:三、MCMC 采样 - 图13 。如:取 ,则有:

      三、MCMC 采样 - 图14

      令: ,则有 三、MCMC 采样 - 图15 。其中 构成了转移矩阵 三、MCMC 采样 - 图16 。而 恰好满足细致平稳条件,因此它对应的马尔可夫链的平稳分布就是 三、MCMC 采样 - 图17

    3. 在改造 的过程中引入的 三、MCMC 采样 - 图18 称作接受率。其物理意义为:在原来的马尔可夫链上,从状态 以 三、MCMC 采样 - 图19 的概率跳转到状态 的时候,以 三、MCMC 采样 - 图20 的概率接受这个转移。

      • 如果接受率 太小,则改造马尔可夫链过程中非常容易原地踏步,拒绝大量的跳转。这样使得马尔可夫链遍历所有的状态空间需要花费太长的时间,收敛到平稳分布 三、MCMC 采样 - 图21 的速度太慢。

      • 根据推导 ,如果将系数从 1 提高到 三、MCMC 采样 - 图22 ,则有:

    4. 三、MCMC 采样 - 图23 同比例放大,取: 。

      • 三、MCMC 采样 - 图24 时: ,此时满足细致平稳条件。
      • 三、MCMC 采样 - 图25 时: ,此时满足细致平稳条件。
    5. MH 算法:

      • 输入:

        • 先验转移概率矩阵 三、MCMC 采样 - 图26
        • 目标分布
      • 输出: 采样出的一个状态序列 三、MCMC 采样 - 图27

      • 算法:

        • 初始化

        • 三、MCMC 采样 - 图28 执行迭代。迭代步骤如下:

          • 根据 采样出候选样本 三、MCMC 采样 - 图29 ,其中 为转移概率函数。

          • 计算 三、MCMC 采样 - 图30

          • 根据均匀分布从 三、MCMC 采样 - 图31 内采样出阈值 ,如果 三、MCMC 采样 - 图32 ,则接受 , 即 三、MCMC 采样 - 图33 。否则拒绝 , 即 三、MCMC 采样 - 图34

        • 返回采样得到的序列

    3.2 Gibbs 算法

    1. 算法不仅可以应用于一维空间的采样,也适合高维空间的采样。

      对于高维的情况,由于接受率 三、MCMC 采样 - 图35 的存在(通常 ),MH算法的效率通常不够高,此时一般使用 Gibbs 采样算法。

    2. Gibbs 算法:

      • 输入:目标分布 三、MCMC 采样 - 图36 ,其中

      • 输出: 采样出的一个状态序列 三、MCMC 采样 - 图37

      • 算法步骤:

        • 初始化:随机初始化 。

        • 执行迭代,迭代步骤如下:

          • 随机或者以一定次序遍历索引 三、MCMC 采样 - 图38 。遍历过程为(设当前索引为 ):

            • 三、MCMC 采样 - 图39 保持不变,计算条件概率: 。

              该条件概率就是状态转移概率 三、MCMC 采样 - 图40

            • 根据条件概率 对分量 三、MCMC 采样 - 图41 进行采样,假设采样结果为 ,则获得新样本 三、MCMC 采样 - 图42

            • 令 ,继续遍历。