Adaboost

作者: 大熊的Yowai | 来源:发表于2019-08-23 22:56 被阅读0次

2019-01-06[Stay Sharp] AdaBoost
第8章 Adaboost算法
提升方法
The Optimization of the Adaboost
adaboost和xgboost的区别和联系
集成算法整理
Adaboost算法简介
4. AdaBoost 自适应推进
机器学习算法：GBDT
04 集成学习 - Boosting - AdaBoost算法构

Adaboost

集成学习

定义

在机器学习的有监督学习算法中，我们的目标是学习出一个稳定且在各个方面表现都较好的模型，但是实际情况往往不这么理想，有时候我们只能得到多个有偏好的模型（弱监督模型，在某些方面表现的比较好）。

集成学习就是组合这里的多个弱分类器以得到一个更好更全面的强分类器，集成学习潜在的思想是：即便某些弱分类器得到了错误的预测，其他的弱分类器也可以将其纠正回来。

特点：

将多个分类方法聚集在一起，以提高分类的准确率。
集成学习法由训练数据构建一组基分类器，然后通过对每个分类器的预测进行投票分类。
严格的说，集成学习不是一种分类器，而是一种分类器结合的方法。
通常一个集成分类器的分类性能会好于单个分类器。
如果把单个分类器比作一个决策者的话，集成学习的方法就相当于多个决策者共同进行一项决策。

种类：

序列集成方法：参与训练的基础学习器按照顺序生成（例如Adaboost），序列方法的原理是利用基础学习器之间的依赖关系，通过对之前训练中错误标记的样本赋值较高的权重，可以提高整体的预测效果。
并行集成方法：参与训练的的基础学习器并行生成（例如Random Forest）。并行方法的原理是利用基础学习器之间的独立性，通过平均可以显著降低错误。

新算法：

Bagging+决策树=随机森林

Adaboost+决策树=提升树

Gradient Boosting+决策树=GBDT

Adaboost

Adaboost的核心问题

在每一轮如何改变训练数据的权值？

通过提高哪些在前一轮被弱分类器分错样例的权值，减小前一轮分对样例的权值，来让分类器对误分的数据有较好的效果。
怎么组合弱分类器？

通过加法模型将弱分类器进行线性组合。刚开始训练时对每一个训练样本赋相同的权重，然后训练T轮，每次训练后都改变样本的权重，也就是说每次都让分类器更关注分错的样本，从而得到多个分类器。通过拟合残差的方式逐步减小残差，将每一步生成的模型叠加得到最终模型。
image

$result=sign[\sum { { \alpha }_{ n }{ T }_{ n }(x) } ]$

Adaboost计算过程

Adaboost是adapitive boosting（自适应boosting）的缩写。

1.计算样本权重

训练数据中的每个样本，赋予其权重，用向量D表示，这些权重都初始化成相等值。假设有n个样本的训练集：
$\{ ({ x }_{ 1 },{ y }_{ 1 }),({ x }_{ 2 },{ y }_{ 2 })...({ x }_{ m },{ y }_{ m })\}$
设定每个样本的权重都是相等的，即 $\frac { 1 }{ m }$ 。

2.计算样本错误率

利用第一个弱学习器算法 ${ T }_{ 1 }(x)$ 对其进行训练，训练完成后对错误率 $\epsilon$ 的统计：
$\epsilon =\frac { 未正确分类的项目 }{ 所有样本数目 }$

3.计算分类器权重

${ \alpha }=\frac { 1 }{ 2 } ln(\frac { 1-\epsilon }{ \epsilon } )$

4.更新样本权重

在第一个分类器训练完成后，需要重新调整样本的权重，以使得第二个分类器更注重分类错误的样本，从而对其重点学习：
${ D }_{ t+1 }(i)=\frac { { D }_{ t }(i) }{ { Z }_{ t } } x\begin{cases} { e }^{ -\alpha t }\quad \quad \quad if\quad { T }_{ t }({ x }_{ i })={ y }_{ i } \\ e^{ \alpha t }\quad \quad \quad \quad if\quad { T }_{ t }({ x }_{ i })≠{ y }_{ i } \end{cases}$
其中 ${ Z }_{ t }$ 是归一化因子， ${ Z }_{ t }=sum(D)$ 。

将以上两个式子合并：
${ D }_{ t+1 }(i)=\frac { { D }_{ t }(i)exp(-{ \alpha }_{ t }{ y }_{ i }{ T }_{ t }(x)) }{ sum(D) }$

5.结果输出

重复进行分类器学习，经过 $n$ 轮学习后，就会得到 $n$ 个弱分类器，以及各个弱分类器的权重：

$n个分类器\quad \quad \quad \quad \quad \quad \quad \{ { T }_{ 1 },{ T }_{ 2 }...{ T }_{ n }\}$

$n个权重\quad \quad \quad \quad \quad \quad \quad\quad \{ { \alpha }_{ 1 },{ \alpha }_{ 2 }...{ \alpha }_{ n }\}$

对弱分类器进行线性组合：
$result=sign[\sum { { \alpha }_{ n }{ T }_{ n }(x) } ]$

2019-01-06[Stay Sharp] AdaBoost
What is AdaBoost? AdaBoost, short for Adaptive Boosting, ...
第8章 Adaboost算法
内容一、Adaboost简介二、Adaboost算法过程三、Adaboost算法的训练误差分析四、Adab...
提升方法
提升方法提升方法 AdaBoost 算法 AdaBoost算法的训练误差分析 AdaBoost算法的解释提升树...
The Optimization of the Adaboost
The Optimization of the Adaboost 1.对于Adaboost error funct...
adaboost和xgboost的区别和联系
机器学习算法中GBDT与Adaboost的区别与联系是什么？ Adaboost Adaboost是模型为加法模型，...
集成算法整理
一.AdaBoost的算法在学习adaboost算法前先要弄清楚前向分布算法，因为AdaBoost是前向分布加法...
Adaboost算法简介
Adaboost算法 Adaboost算法是一种有监督的学习方法，是基于Adaboost算法的分类器把若干个分类器...
4. AdaBoost 自适应推进
1.名词解释 Boost(推进)，adaboost（adapt boost）自适应推进算法：Adaboost算法是...
机器学习算法：GBDT
1. Adaboost 的全局过程 2.AdaBoost 和GradientBoost 的公式 3.GBDT 算法...
04 集成学习 - Boosting - AdaBoost算法构
03 集成学习 - Boosting - AdaBoost算法原理十、AdaBoost算法构建上一章最后说明了...

Adaboost

Adaboost

集成学习

定义

特点：

种类：

新算法：

Adaboost

Adaboost的核心问题

在每一轮如何改变训练数据的权值？

怎么组合弱分类器？

Adaboost计算过程

1.计算样本权重

2.计算样本错误率

3.计算分类器权重

4.更新样本权重

5.结果输出

相关文章

2019-01-06[Stay Sharp] AdaBoost

第8章 Adaboost算法

提升方法

The Optimization of the Adaboost

adaboost和xgboost的区别和联系

集成算法整理

Adaboost算法简介

4. AdaBoost 自适应推进

机器学习算法：GBDT

04 集成学习 - Boosting - AdaBoost算法构

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读