1. 有三种添加噪声的策略:输入噪声注入、权重噪声注入、输出噪声注入。
    1. 权重噪声注入:将噪音作用于权重。这项技术主要用于循环神经网络。

    2. 权重噪声注入可以解释为:将权重视作不确定的随机变量(拥有某个概率分布),向权重注入噪声是对该随机变量采样得到的一个随机值。

    3. 在某些假设下,权重噪声注入等价于传统的参数正则化形式。

    4. 假设有一个 层的标准的深度前馈神经网络,我们将噪声注入到该网络的权重。

      假设 四、噪声鲁棒性 - 图1 ,则有:

      常数项包含了高斯分布的方差(与 四、噪声鲁棒性 - 图2 无关)。

      于是目标函数重写为: 。

    5. 假设每个权重添加一个随机扰动 四、噪声鲁棒性 - 图3, 它是一个均值为0、方差为 的标准正态分布。

      假设有 四、噪声鲁棒性 - 图4 ,即:模型对于增加扰动之后的期望等于原来的模型。

      于是:

      根据:

      四、噪声鲁棒性 - 图5

      于是有:

      四、噪声鲁棒性 - 图6

    1. 如果是简单的线性回归,即 ,则权重噪声注入等价的参数正则化项退化为 四、噪声鲁棒性 - 图7

      该正则化项与模型的参数无关,因此对 关于 四、噪声鲁棒性 - 图8 的梯度没有贡献,因此目标函数可以重写为: 。

    1. 有些数据集存在少量的 四、噪声鲁棒性 - 图9 标签是错误的,此时通过最大似然准则来最大化 是不正确的。

      输出噪声注入显式地对标签上的噪音进行建模:假设某个很小的常数 四、噪声鲁棒性 - 图10, 标签 是正确的概率为 四、噪声鲁棒性 - 图11 、是错误的概率为 。

    2. 基于 四、噪声鲁棒性 - 图12 个输出的单元的标签平滑正则化:将真实的标签从 替换为 四、噪声鲁棒性 - 图13

      原始的标签: 个为 , 一个为 。注入噪声之后的标签:四、噪声鲁棒性 - 图14 个为 ,一个为 四、噪声鲁棒性 - 图15