美文网首页
决策树回顾

决策树回顾

作者: thelong的学习日记 | 来源:发表于2021-07-31 21:25 被阅读0次

简述决策树的原理?

决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直观地“分而治之”策略。
决策树学习的关键是选择最优划分属性。一般而言,随着划分过程不断进行,决策树的分支节点所包含的样本将趋近于同一类别,即节点的“纯度”越来越高。
衡量纯度的指标有:信息熵、增益率、基尼指数。

什么是ID3决策树?

ID3决策树是以信息增益为准则来选择划分属性,信息增益即代表选择某划分属性前后的信息熵的差值,信息增益越大,意味着该属性越适合被选择去划分。

什么是C4.5决策树?

C4.5决策树是以增益率为准则来选择划分属性,由于信息增益准则对可取值数目多的属性有所偏好,为减少这种偏好带来的不利影响,增益率被提出,其定义为:将信息增益比上一个固有值(随着取值数目的增多而增大的一个固定值)。但需要注意的是C4.5算法并不是直接选择增益率最大的属性,因为增益率准则对可取值数目较少的属性有偏好,C4.5算法先从候选属性中找出信息增益高于平均水平的属性,然后再从中选择增益率最高的。这是一个启发式的规则。

什么是CART决策树?

CART决策树使用“基尼指数”来选择划分属性,基尼指数反映了从数据集中随机抽取两个样本,其类别标记不一致的概率。选择基尼系数的原因是为了减少计算量,且易于理解。

决策树如何做回归?

首先,我们要明白,什么是回归树,什么是分类树。两者的区别在于样本输出,如果样本输出是离散值,那么这是一颗分类树。如果果样本输出是连续值,那么那么这是一颗回归树。
除了概念的不同,CART回归树和CART分类树的建立和预测的区别主要有下面两点:
    1)连续值的处理方法不同
    2)决策树建立后做预测的方式不同。
对于连续值的处理,我们知道CART分类树采用的是用基尼系数的大小来度量特征的各个划分点的优劣情况。但是对于回归模型,我们使用了常见的和方差的度量方式。CART回归树的度量目标是,对于任意划分特征A,对应的任意划分点s两边划分成的数据集D1和D2,求出使D1和D2各自集合的均方差最小,同时D1和D2的均方差之和最小所对应的特征和特征值划分点
对于决策树建立后做预测的方式,上面讲到了CART分类树采用叶子节点里概率最大的类别作为当前节点的预测类别。而回归树输出不是类别,它采用的是用最终叶子的均值或者中位数来预测输出结果。

决策树的缺点

1)决策树算法非常容易过拟合,导致泛化能力不强。可以通过设置节点最少样本数量和限制决策树深度来改进。
2)决策树会因为样本发生一点点的改动,就会导致树结构的剧烈改变。这个可以通过集成学习之类的方法解决。
3)寻找最优的决策树是一个NP难的问题,我们一般是通过启发式方法,容易陷入局部最优。可以通过集成学习之类的方法来改善。
4)有些比较复杂的关系,决策树很难学习,比如异或。这个就没有办法了,一般这种关系可以换神经网络分类方法来解决。
5)如果某些特征的样本比例过大,生成决策树容易偏向于这些特征。这个可以通过调节样本权重来改善。

简述GBDT的原理?

相关文章

  • 决策树回顾

    简述决策树的原理? 决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直...

  • AI学习之决策树算法介绍

    决策树算法是机器学习中很经典的一个算法,原理简单、性能优异,这里对决策树算法进行一个介绍。 一、信息论回顾 我们前...

  • 【基于模型的协同过滤2】决策树模型

    今天我们集中主要讨论如何将决策树模型抽象到协同过滤问题,在讨论之前,首先回顾一下决策树模型在传统分类问题上的作用。...

  • 机器学习6-决策树

    一. 决策树概述 1.1 什么是决策树 决策树输入: 测试集决策树输出: 分类规则(决策树) 1.2 决策树算法概...

  • 机器学习之决策树(二)

    今天我们探讨一下有关决策树的剪枝,以及由剪枝引出的一系列问题 为什么要剪枝 回顾上一节,我们知道决策树的生成是要达...

  • 决策树

    1、决策树 决策树学习通常包括3个步骤: 特征选择。 决策树生成。 决策树剪枝。 决策树的学习目标是:根据给定的训...

  • 决策树

    决策树 决策树模型与学习 特征选择 决策树的生成 决策树的剪枝 CART 算法 决策树模型呈树形结构,在分类问题中...

  • 决策树算法总结

    目录 一、决策树算法思想 二、决策树学习本质 三、总结 一、决策树(decision tree)算法思想: 决策树...

  • 机器学习 - 决策树算法[一]

    1 决策树模型与学习 1.1 决策树模型 决策树定义: 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由...

  • 机器学习系列(三十六)——回归决策树与决策树总结

    本篇主要内容:回归决策树原理、回归树学习曲线、决策树总结 回归决策树原理 回归决策树树是用于回归的决策树模型,回归...

网友评论

      本文标题:决策树回顾

      本文链接:https://www.haomeiwen.com/subject/toskvltx.html