学习率

作者: Arya鑫 | 来源:发表于2017-08-19 18:40 被阅读38次

特征缩放和学习速率选取

特征缩放

实际当我们在计算线性回归模型的时候,会发现特征变量x,不同维度之间的取值范围差异很大。这就造成了我们在使用梯度下降算法的时候,由于维度之间的差异使得Jθ的值收敛的很慢。

我们还是以房价预测为例子,我们使用2个特征。房子的尺寸(1~2000),房间的数量(1-5)。以这两个参数为横纵坐标,绘制代价函数的等高线图能看出整个图显得很扁,假如红色的轨迹即为函数收敛的过程,会发现此时函数收敛的非常慢。

为了解决这个问题,我们采用特征缩放

所谓的特征缩放就是把所有的特征都缩放到一个相近的取值范围内。比如-1~1,或者-0.5~2,或者-2~05 等等,只要不超过-3 ~ 3这个范围,基本上都能够满足梯度下降算法


梯度下降算法中,最合适即每次跟着参数θ变化的时候,J(θ)的值都应该下降。

梯度下降算法每次迭代,都会受到学习速率α的影响。

如果α较小,则达到收敛所需要迭代的次数就会非常高;

如果α较大,则每次迭代可能不会减小代价函数的结果,甚至会超过局部最小值导致无法收敛,则会导致代价函数振荡。


文献中学习率选择方法


吴恩达教学中讲到:

α初始值位0.001, 不符合预期乘以3倍用0.003代替,不符合预期再用0.01替代,如此循环直至找到最合适的α。



http://blog.csdn.net/u012162613/article/details/44265967

http://blog.csdn.net/chenguolinblog/article/details/52138510

http://www.cnblogs.com/yjbjingcha/p/7094816.html

https://www.zhihu.com/question/54097634





相关文章

  • 深度学习:学习率learning rate 的设定规律

    Introduction 学习率 (learning rate),控制 模型的 学习进度 : 学习率大小 学习率 ...

  • 2018-04-07 深度学习训练中 超参数调整 笔记

    超参数 1 学习率 初始值0.1, 如何调整学习率,准确率不再下降,就减小学习率。准确率下降太慢,就增大学习率 2...

  • 学习率

    学习速率(learning rate,η) 运用梯度下降算法进行优化时,权重的更新规则中,在梯度项前会乘以一个系数...

  • 学习率

    特征缩放和学习速率选取 特征缩放 实际当我们在计算线性回归模型的时候,会发现特征变量x,不同维度之间的取值范围差异...

  • Keras使用

    参考:Keras学习率调整深度学习框架Keras使用心得 一、如何调整学习率 Keras提供两种学习率适应方法,可...

  • 如何提高个人学习效率的五大模型

    学习金字塔 原理:学习记忆留存率随时间而下降,主动学习比被动学习效果好操作:主动学习留存率90%被动学习留存率20...

  • tensorflow 学习率控制

    为什么调整学习率 学习率的调整 离散下降(discrete staircase)对于深度学习来说,每 tt 轮学习...

  • 机器学习,模型学不到东西或者开始学习学的很慢

    出现这种情况,可以试着把学习率调高,学习率太低就需要学习很多个epoch才能学到东西。

  • caffe Layers及参数

    1、Convolution层: 层类型:Convolution参数:lr_mult: 学习率系数,最终的学习率 =...

  • 2019-03-24

    学习率的调整 从梯度下降算法的角度来说,通过选择合适的学习率,可以使梯度下降法得到更好的性能。学习率,即参数到达最...

网友评论

      本文标题:学习率

      本文链接:https://www.haomeiwen.com/subject/brntdxtx.html