美文网首页
机器学习-模型评估

机器学习-模型评估

作者: 郭姣姣 | 来源:发表于2017-03-16 08:49 被阅读0次

1.归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好,称为归纳偏好。

*两种决策

适用情形尽可能少(经验误差),适用情形尽可能多(过拟合)。

*常用基本原则

“奥卡姆剃刀”原则:若有多个假设与观察一致,则选最简单的那个。

2.经验误差与过拟合

我们希望得到范化误差小的学习器,而实际只能使经验误差最小。通常分类精度为100%,经验误差小的学习器因过拟合效果不佳。我们的目的是学出适用于所有潜在样本的普遍规律。

欠拟合由学习能力低下造成,比较容易克服如拓展决策树分支,增加神经网络训练轮数。而过拟合则是机器学习的关键障碍,我们试图通过经验误差最小化获得最优解就意味着我们构造了“P=NP”,只要相信“P!=NP”,过拟合就不可避免。各类学习算法有一些针对过拟合的措施,只能缓解和减小风险。

3.评估过程指标

错误率=分类错误

精度=1-错误率

误差=误差期望=实际预测与实际输出差异

期望=平均=概率*结果

经验误差=训练误差

范化误差=新样本误差

过拟合=过配(把样本自身特点当做潜在样本的一般性质)

欠拟合=欠配

4.评估方法

通过测试集测试学习器对新样本的辨别能力。用测试误差模拟范化误差。

即使采用相同训练/测试集划分方法,也需进行若干次随机划分,重复进行实验评估后取测试误差平均值作为评估结果。

5.训练集和测试集的划分方法

测试样本在真实样本中独立同分布采样。

测试集与训练集互斥。并且要尽可能保持数据分布的一致性。避免引入额外偏差。

留出法

将数据集划分为两个互斥集合分别作为训练集和测试集。训练/测试集需尽可能保持数据分布一致。测试集占比一般为2/3~4/5。

相关文章

  • Spark机器学习笔记

    Spark机器学习笔记 机器学习 机器学习是数据通过算法构建出模型并对模型进行评估,评估的性能如果达到要求就拿这个...

  • 一文深度解读模型评估方法

    本文将总结机器学习最常见的模型评估指标。训练学习好的模型,通过客观地评估模型性能,才能更好实际运用决策。模型评估主...

  • 【Spark Mllib】性能评估 ——MSE/RMSE与MAP

    推荐模型评估 本篇我们对《Spark机器学习1.0:推荐引擎——电影推荐 》模型进行性能评估。 MSE/RMSE ...

  • 【百面机器学习】优化算法

    机器学习算法 = 模型表征 + 模型评估 + 优化算法。不同的优化算法对应的模型表征和评估指标分别为线性分类模型和...

  • 机器学习模型评估指标示例

    选择正确的度量来评估机器学习模型 我们什么时候评估我们的机器学习模型呢?答案不是只有一次。通常,我们在实际的数据科...

  • C#机器学习之判断日报是否合格

    简单来说机器学习的核心步骤在于“获取学习数据;选择机器算法;定型模型;评估模型,预测模型结果”,下面本人就以判断日...

  • 机器学习模型评估

    1.训练集测试集划分方案 a)留出法hold-out 直接将原始数据集D划分为两个互斥集合,其中一个作为训练集S,...

  • 机器学习-模型评估

    1.归纳偏好 机器学习算法在学习过程中对某种类型假设的偏好,称为归纳偏好。 *两种决策 适用情形尽可能少(经验误差...

  • 【机器学习】①模型评估

  • 评估机器学习模型

    机器学习的目的是得到泛化(generalize)的模型,因此,解决过拟合很重要。 训练集、验证集、测试集 将数据分...

网友评论

      本文标题:机器学习-模型评估

      本文链接:https://www.haomeiwen.com/subject/nuddnttx.html