美文网首页
训练神经网络时,训练集loss下降,但是验证集loss一直不下降

训练神经网络时,训练集loss下降,但是验证集loss一直不下降

作者: 小小杨树 | 来源:发表于2021-09-24 00:16 被阅读0次

参考:https://www.zhihu.com/question/367350659
可以判定问题的原因来自两方面,一方面是模型过拟合,另一方面是训练集和测试机的数据域不同。

一、问题定位:

至于问题的定位排查,建议按照先易后难的角度,也就是先排查训练集和测试集是否存在数据域的不同,再排查模型是否过拟合。

1.关于数据域的排查

具体来讲就是查验训练集和测试集的数据分布不一致,具体来说有如下几点

(1)数据源分布不一样:例如在图像处理中,训练集的图像采集使用的是摄像头A拍摄的,而测试集是摄像头B拍摄的,但是摄像头A和B的拍摄效果差别较大(例如:图像成图的清晰度、对比度等);在语音识别中,训练集是音频普通话较多,测试集却很多方言;

(2)数据集的噪声干扰不同:例如在图像中,训练集的图像都是正常拍摄,但是测试集的图像都是昏暗的或遮挡的;在语音识别中,训练集可能都是清晰的音频,测试集却有很多背景杂音等。

2.关于过拟合的排查

如果不是数据域的问题,那么可以基本判定训练集和测试集的数据域是一致的。那么问题可以归为模型过拟合。

二、问题对应的解决方案

1)数据域问题的解决方式

重新编排训练集和测试集的数据组成比例,尽量做到数据在训练集和测试集上分布是一致的。

2)过拟合问题的解决方式

针对过拟合问题,一般是从数据增广和模型复杂度两个角度去处理。

(1)在数增广上,尽量在训练时增加一些在线增广的策略,例如,图像处理中,增加图像的扭曲、噪声点、扭曲、模糊等。

(2)在模型复杂度上,可以适当的增加些dropout、normal等操作,或者增减一些网络层数和数据加权等。

相关文章

  • 训练神经网络时,训练集loss下降,但是验证集loss一直不下降

    参考:https://www.zhihu.com/question/367350659[https://www.z...

  • 2019-03-04

    # 1. 过拟合表现: - 模型对训练集表现很好,对测试集拟合不好 - Loss(训练)小,Loss(测试)大 #...

  • 2019-08-15工作进展

    昨天工作: mvdssm:网络训练完成,训练阶段网络的title loss基本上没有下降,pic loss表现的比...

  • 调参整理

    RF,GBDT,xgboost调参方法整理 训练集、测试集loss容易出现的问题总结 train loss 不断下...

  • 机器学习误差与改进策略(一)

    一. 如何评估泛化能力 在机器学习中,我们用训练数据集去训练一个模型,通常会定义一个Loss误差函数。通过梯度下降...

  • Pytorch 分类问题

    train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,t...

  • LOSS tips

    train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,te...

  • train loss与test loss结果分析

    train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,t...

  • NLP学习遇到问题

    一、 无论如何调参训练,loss都无法下降,而且训练后的loss与开始时相比仅仅小了一到两个数量级? 二、trai...

  • fast.ai-深度学习笔记-Part1-lesson2

    数据集文件结构 以「猫狗识别」为例 训练结果 epoch(训练次数)training loss(训练集损失值)va...

网友评论

      本文标题:训练神经网络时,训练集loss下降,但是验证集loss一直不下降

      本文链接:https://www.haomeiwen.com/subject/hncogltx.html