美文网首页模型压缩
模型压缩(三):量化

模型压缩(三):量化

作者: 夕一啊 | 来源:发表于2020-04-29 21:55 被阅读0次
  1. 用更少的bit来存参数,(例如32个bit改成16个bit)

  2. 把参数分群,用更少的bit来代表参数

  3. 通过霍夫曼编码,把出现频率高的值用更少的bit来表示


只用正一负一两个值来表示网络。
存一组真实值的参数,还有二值化参数。
随机初始化一组参数,通过最近的二值化参数计算梯度方向,根据方向优化真实参数,再找最接近的。知道最后一次找到真实参数最近的二值化参数。


在论文中结果很好,有的数据集比真实参数错误率还低。
有点像正则化。


相关文章

网友评论

    本文标题:模型压缩(三):量化

    本文链接:https://www.haomeiwen.com/subject/rdjowhtx.html