1.宽泛策略
前期你应该从实验中尽可能早的获得快速反馈(简化问题和架构),这能够将进度加快,因为你能够更快地找到传达出有意义的信号的⽹络。⼀旦获得这些信号,就可以尝尝通过微调超参数获得快速的性能提升。万事开头难
2.学习速率
学习速率主要的⽬的是控制梯度下降的步⻓,监控训练
代价是最好的检测步⻓过⼤的⽅法
3.使⽤提前停⽌来确定训练的迭代期数量
分类准确率在⼀段时间内不再提升的时候终⽌
4.⼩批量数据⼤⼩
在实践中,我们⼤多数情况肯定是要实现
更快的⼩批量数据更新策略,然后花费时间精⼒来优化⼩批量数据⼤⼩,来达到总体的速度提升
5.⾃动技术
⽹格搜索(grid search),可以系统化地对超参数的参数空间的⽹格进⾏搜索
网友评论