ID3

作者: 苏啦啦哇咔咔 | 来源:发表于2018-12-21 15:13 被阅读9次

决策树方法最早产生于上世纪60年代,到70年代末。由JRossQuinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。(比较于随机选择属性作为分裂节点来说,每次选择信息增益最大的属性可以减少树的深度。)

基本思想:

从上至下,分而治之的递归过程。
对当前例子集合,计算属性的信息增益;选择信息增益最大的属性Ai;把在Ai处取值相同的例子归于同一子集,Ai取几个值就得几个子集;对依次对每种取值情况下的子集,递归调用建树算法,即返回a;若子集只含有单个属性,则分支为叶子节点,判断其属性值并标上相应的符号,然后返回调用处。

属性选择

基于熵的信息增益

终止条件

1.数据已经不能继续再分
2.所有属性都已用尽
3.该群数据没有任何未处理的数据

优点

  • 不存在无解的危险
  • 可以利用全部训练例的统计性质进行决策,从而抵抗噪音。

缺点

  • 只能处理分类数据,不能处理连续数据
  • 划分过程会由于子集规模过小而造成统计特征不充分而停止
  • D3算法在选择根节点和各内部节点中的分支属性时,采用信息增益作为评价标准。信息增益的缺点是倾向于选择取值较多的属性,在有些情况下这类属性可能不会提供太多有价值的信息。
  • 处理大型数据速度较慢,经常出现内存不足,不可以并行,不可以处理数值型数据;ID3(并行)和ID3(number)解决了后两个问题。
  • 只适用于非增量数据集,不适用于增量数据集,可能会收敛到局部最优解而非全局最优解,最佳分离属性容易选择属性值多一些的属性。

Python实现


相关文章

  • 决策树和随机森林

    随机森林和GBDT算法的基础是决策树 而建立决策树的算法由很多,ID3,C4.5,CART等, ID3:ID3算法...

  • 机器学习之旅—决策树(3)

    从 ID3 到 C4.5 ID3 定义 ID3 算法的核心是在决策树各个子节点上应用信息增益准则选择特征,递归的构...

  • 决策树简记

    具有不同划分准则的算法决策树原理剖析及实现(ID3)理解决策树算法(实例详解)-ID3算法与C4.5算法 ID3(...

  • 决策树基本要点及方法对比

    决策树的生产,基本方法有ID3、C4.5、CART。基于基础决策树学习器,可进一步构建提升树。 ID3 ID3算法...

  • ID3

    基于信息增益(Information Gain)的ID3算法 ID3算法的核心是在各个结点上应用信息增益准则来进行...

  • decision tree

    ID3 C4.5 CART 比较 ID3(以信息增益为准则选择信息增益最大的属性) 缺点 信息增益对==可取值数目...

  • JS简单实现决策树(ID3算法)

    推荐阅读:ID3算法 wiki决策树算法及实现完整示例代码:JS简单实现决策树(ID3算法)_demo.html ...

  • (14)监督学习-分类问题-决策树

    决策树算法分为ID3,C4.5,CART几种。其主要区别在于特征选择的方法不同。 1、 ID3 特征选择方法...

  • 「数据分类」14决策树分类之CART算法

    1.CART算法与ID3算法对比 (1)CART算法解决了ID3算法的不足,既能用于分类问题,又能用于回归问题。 ...

  • day10-决策树

    今天学了决策树的基本知识。 基于信息论的决策树算法有:ID3, CART, C4.5等算法。 ID3 算法是根...

网友评论

      本文标题:ID3

      本文链接:https://www.haomeiwen.com/subject/krhukqtx.html