美文网首页
四.模型验证

四.模型验证

作者: 愿风去了 | 来源:发表于2018-10-22 23:05 被阅读1次

模型验证就是在选择完模型和超参数之后,通过训练数据进行学习,对比模型对已知数据的预测值与世实际值的差异。

主要方式有留出集和交叉验证。

留出集

所谓留出集就是先从数据中取出一部分来,然后用这部分留出来的数据检验模型性能。

在Sklearn-Learn中使用train_test_split工具就可以实现:

from sklearn.cross_validation import train_test_split

# 对每个数据集分一半数据

#  random_state=0每次随机划分数不同,1每次划分数相同

X1, X2, y1, y2 = train_test_split(X, y, random_state=0, train_size=0.5)

留出类似新数据,这样模型就能够利用数据进行预测验证。

交叉验证

留出集的缺点在于模型失去了一部分训练数据。

解决这个问题的方法就是使用交叉验证,也就是做一组拟合,让数据的每个子集既是训练数据,又是验证集。

交叉验证将数据分为若干组,每一次用模型拟合其中的n-1组数据,再预测剩下的那1组数据,最终选取均值来评估模型的准确率。

极端情况下,每次只有一个样本做测试,其他样本全部用于训练,这种交叉验证模式被称为LOO(leave-one-out,只留一个)交叉验证。

具体用法为:

from sklearn.cross_validation import LeaveOneOut

# 使用cross_val_score函数可以快速计算准确率

scores = cross_val_score(model, X, y, cv=LeaveOneOut(len(X)))

相关文章

  • 四.模型验证

    模型验证就是在选择完模型和超参数之后,通过训练数据进行学习,对比模型对已知数据的预测值与世实际值的差异。 主要方式...

  • Datawhale 零基础入门CV赛事-Task4 模型训练与验

    4 模型训练与验证 为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解,在部分小节中将会...

  • 机器学习笔记(一)——交叉验证

    交叉验证问题 什么是交叉验证     交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,...

  • 2018-07-15-1

    另类验证helper 关联模型验证 部分字段取出验证 利用其它类做验证

  • 深度学习中一些小问题(python篇)

    1.验证集,测试集,训练集间的关系? 训练集:训练模型,或者训练模型参数的 验证集:做模型的优化及最终确定模型参数...

  • Sklearn.metrics 模型效果验证

    Sklearn 模型效果验证 首先声明,在模型验证中,同样也有各种 average 的方法:'macro','mi...

  • 2020-04-01

    线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方...

  • 如何进行变量筛选和特征选择(三)?交叉验证

    01 模型简介 交叉验证是机器学习中常用的一种验证和选择模型的方法,常用的交叉验证方法是K折交叉验证。将原始数据...

  • 用tornado实现图片标记

    背景介绍   在文章Keras入门(四)之利用CNN模型轻松破解网站验证码中,其中的验证码图片标记是采用torna...

  • 李沐-动手学深度学习(2)模型选择、过拟合和欠拟合

    【总结】 训练数据集:训练模型参数; 验证数据集:选择模型超参数。 非大数据集上通常使用k-折交叉验证。 模型容量...

网友评论

      本文标题:四.模型验证

      本文链接:https://www.haomeiwen.com/subject/pyenzftx.html