假定基类分类器的错误率为 ,即对每个基分类器 有: 。 假设集成学习通过简单投票法结合 个基分类器 。即:若有超过半数的基分类器正确,则集成分类就正确。根据描述,给出集成学习器为: 。 根据不等式有: 。 上述推论有非常关键的一个地方:假设基分类器的错误率相互独立。 实际上个体学习器的准确性和多样性本身就存在冲突。 通常个体学习器的准确性很高之后,要增加多样性就需要牺牲准确性。