美文网首页
网络训练tips( updating)

网络训练tips( updating)

作者: pipizhou | 来源:发表于2019-06-21 14:51 被阅读0次

1. GPU利用率很低,训练过程很慢

  • io卡住了,数据导入到内存速度太慢
  • 模型太小
  • 模型中存在耗时的步骤(比如本次项目中的otsu_method,需要遍历像素值寻找最大方差)
解决方法:
  • 加大workers
  • 设置timer,看一下具体哪一步比较慢(是数据处理/还是model部分,forward/backward)
  • 针对上述第三个问题,解决方案是用矩阵优化,是计算并行化

2. Label Smoothing Regularization(LSR) 标签平滑

  • 引入原因:一般情况下,在分类问题中label采用one-hot vector(如三分类中第2类,[0, 1, 0])
  • 适用条件:数据不充足,小部分数据标注有误
  • 原理:

    相当于在ground truth的分布中加入了随机噪声,为了便于计算,噪声服从均匀分布

e.g.
三分类问题,当e = 0.1:
[0, 0, 1] --> [0, 0, 1]*(1-0.1) + 0.1/3 = [0.033, 0.033, 0.933]
代码实现:

def label_smoothing(labels, e=0):
    

3. Resize

训练时把图像的短边随机resize256-480,test的时候扩张图片尺寸(224->288, 299->363)----待试验

相关文章

网友评论

      本文标题:网络训练tips( updating)

      本文链接:https://www.haomeiwen.com/subject/mpvyqctx.html