集成学习

      • 先产生一组“个体学习器”(individual learner) 。个体学习器通常由一种或者多种现有的学习算法从训练数据中产生。

        • 如果个体学习器都是从某一种学习算法从训练数据中产生,则称这样的集成学习是同质的。

      • 再使用某种策略将它们结合起来。集成学习通过将多个学习器进行组合,通常可以获得比单一学习器显著优越的泛化性能。

      • 个体学习器要有一定的准确性,预测能力不能太差。
    1. 通常基于实际考虑,往往使用预测能力较强的个体学习器(即强学习器,与之对应的为弱学习器)。

      强学习器的一个显著的好处就是可以使用较少数量的个体学习器来集成就可以获得很好的效果。

      • 个体学习器之间存在强依赖关系、必须串行生成的序列化方法,每一轮迭代产生一个个体学习器。其中以Boosting为代表。