美文网首页
机器学习--集成学习模型

机器学习--集成学习模型

作者: YCzhao | 来源:发表于2018-11-11 18:42 被阅读0次

Ensemble learning

  • Bagging : 训练多个分类器取平均
  • Boosting : 从弱学习器开始加强,通过加权来进行训练
  • Stacking : 聚合多个分类或回归模型(可以分阶段来做)

一. Bagging模型

  • 全称:bootstrap aggregation(说白了就是并行训练一堆分类器)
  • 最典型的代表就是随机森林
  • 随机:数据采样随机,特征选择随机
  • 森林:很多个决策树并行放在一起








    bagging

二. Boosting模型

  • 典型代表:AdaBoost,Xgboost
  • Adaboost会根据前一次的分类效果调整数据权重
  • 解释:如果某一个数据在这次分错了,那么在下一次我就会给它更大的权重
  • 最终的结果:每个分类器根据自身的准确性来确定各自的权重,再合体



    boosting

三. Stacking模型

  • 堆叠:很暴力,拿来一堆直接上(各种分类器都来了)
  • 可以堆叠各种各样的分类器(KNN,SVM,RF等等)
  • 分阶段:第一阶段得出各自结果,第二阶段再用前一阶段结果训练


四. 集成学习之结合策略
我们假定我得到的T个弱学习器是{h1,h2,...hT}

  1. 平均法
        对于数值类的回归预测问题,通常使用的结合策略是平均法,也就是说,对于若干个弱学习器的输出进行平均得到最终的预测输出。
    最简单的平均是算术平均,也就是说最终预测是



    如果每个个体学习器有一个权重w,则最终预测是



    其中wi是个体学习器hi的权重,通常有
  2. 投票法
        对于分类问题的预测,我们通常使用的是投票法。假设我们的预测类别是{c1,c2,...cK},对于任意一个预测样本x,我们的T个弱学习器的预测结果分别是(h1(x),h2(x)...hT(x))。

最简单的投票法是相对多数投票法,也就是我们常说的少数服从多数,也就是T个弱学习器的对样本x的预测结果中,数量最多的类别ci为最终的分类类别。如果不止一个类别获得最高票,则随机选择一个做最终类别。

稍微复杂的投票法是绝对多数投票法,也就是我们常说的要票过半数。在相对多数投票法的基础上,不光要求获得最高票,还要求票过半数。否则会拒绝预测。

更加复杂的是加权投票法,和加权平均法一样,每个弱学习器的分类票数要乘以一个权重,最终将各个类别的加权票数求和,最大的值对应的类别为最终类别。

  1. 学习法
        上两节的方法都是对弱学习器的结果做平均或者投票,相对比较简单,但是可能学习误差较大,于是就有了学习法这种方法,对于学习法,代表方法是stacking,当使用stacking的结合策略时, 我们不是对弱学习器的结果做简单的逻辑处理,而是再加上一层学习器,也就是说,我们将训练集弱学习器的学习结果作为输入,将训练集的输出作为输出,重新训练一个学习器来得到最终结果。

在这种情况下,我们将弱学习器称为初级学习器,将用于结合的学习器称为次级学习器。对于测试集,我们首先用初级学习器预测一次,得到次级学习器的输入样本,再用次级学习器预测一次,得到最终的预测结果。

相关文章

  • 10.machine_learning_model_ensemb

    机器学习集成学习与boosting模型 机器学习中的集成学习 顾名思义,集成学习(ensemble learnin...

  • iOS机器学习

    核心ML 将机器学习模型集成到您的应用程序中。 使用Core ML,您可以将训练有素的机器学习模型集成到应用程序中...

  • 机器学习--集成学习模型

    Ensemble learning Bagging : 训练多个分类器取平均 Boosting : 从弱学习器开始...

  • 【机器学习六】决策树集成

      集成(ensemble)是合并多个机器学习模型来构建更强大模型的方法。在机器学习文献中有许多模型都属于这一类,...

  • 50-R语言机器学习:集成模型与多类分类

    《精通机器学习:基于R 第二版》学习笔记 1、集成模型简介 集成学习的定义是:“有策略地建立多个模型(如分类器或专...

  • 决策树集成

    集成(ensemble)是合并多个机器学习模型来构建更强大模型的方法。在机器学习文献中有许多模型都属于这一类,但已...

  • 机器学习--有监督--GBM(Boosting)

    集成学习(ensemble learning)是采用多个机器学习模型组合进行综合预测,从而提升模型性能的思路,分为...

  • Task05: 模型集成

    一般的集成学习方法 深度学习中的集成方法 0. 在机器学习中的一般集成方法 模型集成即把同一学习任务的多个独立(弱...

  • 基于sklearn的集成分类器

    理论 集成模型 集成分类器模型是综合考虑多种机器学习模型的训练结果,做出分类决策的分类器模型 投票式:平行训练多种...

  • R语言机器学习与临床预测模型69--机器学习模型解释利器:SHA

    R小盐准备介绍R语言机器学习与预测模型的学习笔记, 快来收藏关注【科研私家菜】 01 机器学习的可解释性 对于集成...

网友评论

      本文标题:机器学习--集成学习模型

      本文链接:https://www.haomeiwen.com/subject/osaxfqtx.html