由知识蒸馏的论文想到一个idea

由知识蒸馏的论文想到一个idea

作者: 半笔闪 | 来源:发表于2019-12-31 14:52 被阅读0次

由知识蒸馏的论文想到一个idea
知识蒸馏论文
深度学习 | 训练网络trick——知识蒸馏
论文阅读_知识蒸馏_MobileBERT
论文阅读_知识蒸馏_TinyBERT
由论文想到的
知识蒸馏与伪标签_1：开山之作
【技术博客】通过量化知识来解释知识蒸馏
由写论文想到
推荐系统遇上深度学习(九十九)-[华为]多教师网络知识蒸馏来提升

老师模型的输出提供了比目标数据集更加丰富的信息，如下图所示，老师模型的输出，不仅提供了输入图片上的数字是数字1的信息，而且还附带着数字1和数字7和9比较像等额外信息。

从上面的说明可以看出，其实知识蒸馏的本质是老师模型从数据中学出了一些dark knowledge，比如在mnist数据集上，数字1可能和7更加像，而和其他数字相像的程度就不太高，这体现在老师模型输出的各个数字的概率上。如果直接用学生模型在数据集上训练，可能也可以一点程度学到dark knowledge，但学生模型的学习能力比老师模型的弱，所以老师模型能学到的更多。由老师模型把这些dark knowledge指明给学生模型学习，让学生模型达到更好的效果。
好，那么问题来了，两个结构不同的模型，是否可以相互作为老师模型，以抓取不同的结构可以学到的不同特征。

相关文章

由知识蒸馏的论文想到一个idea
老师模型的输出提供了比目标数据集更加丰富的信息，如下图所示，老师模型的输出，不仅提供了输入图片上的数字是数字1的信...
知识蒸馏论文
Romero, A.; Ballas, N.; Kahou, S. E.; Chassang, A.; Gatta...
深度学习 | 训练网络trick——知识蒸馏
1.原理介绍知识蒸馏论文地址 Hinton的文章《Distilling the Knowledge in a N...
论文阅读_知识蒸馏_MobileBERT
英文题目：MobileBERT: a Compact Task-Agnostic BERT for Resourc...
论文阅读_知识蒸馏_TinyBERT
英文题目：TINYBERT: DISTILLING BERT FOR NATURAL LAN-GUAGE UNDE...
由论文想到的
本周论文公布结果，发现论文获奖率不高。市三等奖。思索如下： 1 题材非常重要，建议去看公式获奖的名单，保存下来。供...
知识蒸馏与伪标签_1：开山之作
受干扰学生论文里提到6篇知识蒸馏及伪标签暗知识的论文，除去较早发表的3篇，包括以下3篇： 1.Distilling...
【技术博客】通过量化知识来解释知识蒸馏
【技术博客】****通过量化知识来解释知识蒸馏知识蒸馏介绍知识蒸馏（Knowledge Distillatio...
由写论文想到
写论文是我最近几个月的大事，如果这件事情做好了，就可以顺利毕业，做不好就非常麻烦了。凭我对自己的了解，应该是可以写...
推荐系统遇上深度学习(九十九)-[华为]多教师网络知识蒸馏来提升
本文是CIKM20上华为发表的一篇关于使用知识蒸馏来提升点击率预估效果的论文，论文标题是《Ensembled CT...

网友评论

本文标题：由知识蒸馏的论文想到一个idea

本文链接：https://www.haomeiwen.com/subject/jwiboctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|由知识蒸馏的论文想到一个idea|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！