[NLP] BERT模型压缩

[NLP] BERT模型压缩

作者: nlpming | 来源:发表于2021-11-22 15:59 被阅读0次

[NLP] BERT模型压缩
Bert模型_3分钟热情学NLP第11篇
BERT 模型蒸馏 TinyBERT
AI产品经理基础（五）-NLP领军模型BERT
Bert预训练模型
彻底理解 Google BERT 模型
五分钟搭建一个基于BERT的NER模型
基于 BERT 的项目实战（NER、Classification
最强NLP模型-BERT
优雅の使用transformer系列之text-classifi

BERT模型压缩大致分为以下几类：（参考：http://mitchgordon.me/machine/learning/2019/11/18/all-the-ways-to-compress-BERT.html）
（1）剪枝(Pruning)；
（2）权重因式分解(Weight Factorization )，该方法基本思想是将原始的大矩阵分解为两个或多个低秩矩阵的乘积。就模型压缩技术而言主要用于全连接层和卷积层。
（3）知识蒸馏(Knowledge Distillation )，基本思想是将知识从大型的，经过预训练的教师模型转移到通常较小的学生模型中，常见的学生模型根据教师模型的输出以及分类标签进行训练。比如DistillBERT、TinyBERT、MobileBERT等；
（4）权重共享(Weight Sharing)；比如ALBERT等；
（5）量化(Quantization )，量化技术通过减少用于表示每个权重值的精度来压缩模型。例如模型使用float32标准定义参数的精度进行训练，然后我们可以使用量化技术选择float16，甚至int8表示参数的精度用于压缩模型。比如QBERT等；

参考论文

-【预训练模型综述】Pre-trained Models for Natural Language Processing: A Survey
https://arxiv.org/pdf/2003.08271.pdf（邱锡鹏老师 - 视频讲解：https://www.bilibili.com/video/BV16K4y1475Z/）
-【BERT模型压缩综述】Compressing Large-Scale Transformer-Based Models: A Case Study on BERT
https://arxiv.org/abs/2002.11985
-【ALBERT】ALBERT: A Lite BERT for Self-supervised Learning of Language Representations
https://arxiv.org/abs/1909.11942
-【DistillBERT】DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
https://arxiv.org/abs/1910.01108
-【TinyBERT】TinyBERT: Distilling BERT for Natural Language Understanding
https://arxiv.org/abs/1909.10351
-【MobileBERT】MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices
https://arxiv.org/abs/2004.02984
-【QBERT】Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT
https://arxiv.org/abs/1909.05840

参考资料

【李宏毅 - 2020深度学习与人类自然语言处理】http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html
（1）B站视频集合：https://www.bilibili.com/video/BV1H34y1S7y7?p=20
（2）GPT-3模型：https://www.bilibili.com/video/BV1H34y1S7y7?p=33
（3）BERT and its family集合：https://www.bilibili.com/video/BV1H34y1S7y7?p=20&spm_id_from=333.788.b_6d756c74695f70616765.20
预训练模型代码集合：https://github.com/huggingface/transformers
BERT模型压缩方法总结：http://mitchgordon.me/machine/learning/2019/11/18/all-the-ways-to-compress-BERT.html
关于BERT的模型压缩简介 https://zhuanlan.zhihu.com/p/110934513

相关文章

[NLP] BERT模型压缩
BERT模型压缩大致分为以下几类：（参考：http://mitchgordon.me/machine/learni...
Bert模型_3分钟热情学NLP第11篇
3分钟热情学NLP第11篇，Bert模型 BERT ：Bidirectional Encoder Represen...
BERT 模型蒸馏 TinyBERT
BERT 的效果好，但是模型太大且速度慢，因此需要有一些模型压缩的方法。TinyBERT 是一种对 BERT 压缩...
AI产品经理基础（五）-NLP领军模型BERT
什么是BERT BERT是谷歌最新提出的语言模型，在处理NLP的各项任务上，这个通用模型基本完爆所有模型。可以说是...
Bert预训练模型
NLP预训练模型简介旺达一、BERT简单文本分类实例 1、bert详细运行介绍--tensorflow htt...
彻底理解 Google BERT 模型
BERT 模型是 Google 在 2018 年提出的一种 NLP 模型，成为最近几年 NLP 领域最具有突破性的...
五分钟搭建一个基于BERT的NER模型
BERT 简介 BERT是2018年google 提出来的预训练的语言模型，并且它打破很多NLP领域的任务记录，其...
基于 BERT 的项目实战（NER、Classification
1 BERT简介 BERT是2018年google 提出来的预训练的语言模型，并且它打破很多NLP领域的任务记录，...
最强NLP模型-BERT
简介: BERT,全称BidirectionalEncoderRepresentations fromTransf...
优雅の使用transformer系列之text-classifi
前言自bert问世之后，如今的NLP行业无论是研究、赛事还是工程上，都会优先使用bert及其衍生模型进行迁移学...

网友评论

本文标题：[NLP] BERT模型压缩

本文链接：https://www.haomeiwen.com/subject/ihwstrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|[NLP] BERT模型压缩|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！