美文网首页
2018-11-24机器学习第三天

2018-11-24机器学习第三天

作者: hannah1123 | 来源:发表于2018-11-24 22:00 被阅读0次

模型选择

1  模型的错误类型  : 

欠拟合(过度简化了要解决的问题  又称为高偏差模型)  和  过拟合(过度复杂化了要解决的问题,在验证集上表现好,测试集上表现不好  只是记住了数据,而非学习了数据特征  又称为高方差模型)

2  交叉验证

黄金法则  :  永远不能将测试数据用于训练

3  交叉验证集

训练集用于训练参数    交叉验证集用于对模型做出决定,例如多项式的次数

4  K折交叉验证 

循环利用数据

将数据分为K个包 将模型培训K次  每次将不同的包作为测试集 剩下的 为训练集 然后求结果的 平均值 ,来得最终模型

from  sklearn.model_selection  import  KFold

创建一个KFold 对象

kf = KFold(12,3,shuffle  = True ) 参数 为 数据的大小 和 测试集数据的大小 ,初始化KFold 对象 时 将 shuffle  参数 设为 true 即可

for train_indices, test_indices in kf:      print   train_indices , test_indeices

5  学习曲线

通过学习曲线判断 过拟合  欠拟合  ,合适

6  网格搜索  评估并选出合适的参数  (不是很懂!!!!!)

sklearn  中的网格搜索

以SVC为例

参数 : kernel   : poly  和 rbf 

               C:  0.1  1  10

1  导入 GridSearchCV

  from  sklearn.model_selection  import GridSearchCV

2  选择参数

 parameters = {'kernel ':[poly','rbf'], 'C':[0.1,1,10]}

3  创建 一个评分机制

from sklearn.metrics  import  make_scorer

form  sklearn.metrics import  f1_score

scorer  =  make_scorer(f1_score)

4   使用参数和评分机制创建 一个  GridSearch 对象  。使用此对象 与数据保存一种(fit the  data)

grid_obj = GridSearchCV(clf,parameters,scoring = scorer)

grid_fit = gird_obj.fit(X,y)

5  获得 最佳 估算器

best_clf = grid_fit.best_estimator_

相关文章

  • 2018-11-24机器学习第三天

    模型选择 1 模型的错误类型 : 欠拟合(过度简化了要解决的问题 又称为高偏差模型) 和 过拟合(过度复杂化了要解...

  • 机器学习 Day 3 | Multiple Linear Reg

    机器学习第三天 多元线性回归 数据集下载地址https://www.xiehaoo.com/media/reco...

  • LeetCode刷题DAY 3:罗马数字转整数

    原文链接:LeetCode刷题DAY 3:罗马数字转整数 微信公众号:机器学习养成记 LeetCode刷题第三天。...

  • 机器学习概述与算法介绍(二)

    机器学习概述 机器学习基本概念 机器学习基本流程与工作环节 机器学习中的评估指标 机器学习算法一览 3. 机器学习...

  • 2018-11-24

    2018-11-24 姓名:张正强 公司:江阴嘉鸿橡塑科技有限公司 【日精进打卡第️️38天】 【知~学习】 《六...

  • 2018-11-25

    2018-11-24 姓名:王相松 公司:扬州滋奇餐饮有限公司 【日精进打卡第12天】 【知~学习】 《六项精进》...

  • 「零基础」python机器学习入门(一)| 什么是机器学习?

    了解什么是机器学习?为什么需要机器学习? 一、什么是机器学习? 字面上,「机器学习」可以拆分为两个词:机器、学习。...

  • Python3 机器学习简明教程

    1 机器学习介绍    1.1 什么是机器学习    1.2 机器学习的应用    1.3 机器学习基本流程与工作...

  • 什么是深度学习

    1.1 人工智能、机器学习与深度学习 人工智能 > 机器学习 > 深度学习 即,人工智能包括机器学习,机器学习包括...

  • 机器学习

    1、人工智能->机器学习->深度学习 注:->包含关系 2、机器学习领域: 模式识别=机器学习 数据挖掘=机器学习...

网友评论

      本文标题:2018-11-24机器学习第三天

      本文链接:https://www.haomeiwen.com/subject/dadyqqtx.html