一、剪枝理论基础
二、剪枝四部曲
- 1、代价函数复杂度
- 2、非叶子节点的表面误差率增益率(误差增加的速度)公式推导(代价函数负责度的差):当多个非叶子节点的α值同时达到最小时,取|NTt|最大的进行剪枝。计算表面误差率增益率
- 3、剪枝,得到一系列α的值和对应的子树序列T0,T1...
- 4、交叉验证,选取最优α
1、代价函数复杂度
代价复杂函数
2、表面误差率增益率:最难以理解的一步
表面误差率公式
3、剪枝
剪枝
4、交叉验证
交叉验证
三、参考
1、Cost-Complexity_Pruning
2、决策树的剪枝算法
3、CART剪枝详解
4、 cart树ccp剪枝详细介绍












网友评论