决策树
离散型数据ID3
连续型数据C4.5
分类与回归树算法(CART)
CART算法就是将决策树中用于判断特征重要的方式由ID3的信息熵变成了基尼系数。
一个好的特征应该是而可以将所有待判别对象明确分开的。在使用某特征进行划分后,会计算得到两部分的基尼系数,基尼指数越小,则说明这种划分就越靠谱。特征的重要性取决于哪个特征能够最大程度的减小基尼系数,使基尼系数最小的那个特征划分便是对我们来说最重要的特征。
决策树
离散型数据ID3
连续型数据C4.5
分类与回归树算法(CART)
CART算法就是将决策树中用于判断特征重要的方式由ID3的信息熵变成了基尼系数。
一个好的特征应该是而可以将所有待判别对象明确分开的。在使用某特征进行划分后,会计算得到两部分的基尼系数,基尼指数越小,则说明这种划分就越靠谱。特征的重要性取决于哪个特征能够最大程度的减小基尼系数,使基尼系数最小的那个特征划分便是对我们来说最重要的特征。
本文标题:2019-04-26
本文链接:https://www.haomeiwen.com/subject/vlwxnqtx.html
网友评论