半监督学习

    1. 学习器自动地利用未标记的 来提升学习性能,这就是半监督学习。

    2. 半监督学习的现实需求非常强烈,因为现实中往往能够容易地收集到大量未标记样本,但是对其标记需要耗费大量的人力、物力。如:在医学影像分析上,对影像的疾病标记需要专家人工进行。

    3. 虽然未标记样本集 12.半监督学习 - 图1 没有直接包含标记信息,但是如果假设 与带 12.半监督学习 - 图2 从同样的数据源独立同分布采样而来,则 所包含的关于数据分布的信息对建立模型是有好处的。

      • 纯半监督学习:假定训练数据中的未标记样本集 12.半监督学习 - 图3 并非待预测的数据。

        纯半监督学习是开放性的,它学得的模型能够适用于额外的未观测数据。

      • 直推学习是封闭性的,它学得的模型仅仅是针对学习过程中的未标记样本集 。