关键词:大语言模型,LLaMA 内容摘要 LLaMA大模型背景介绍 LLaMA网络结构相比Transformer的...[作者空间]
关键词:GPT,预训练模型 前言 在前文GPT系列:GPT-2模型结构简述和实践[https://www.jian...[作者空间]
关键词:Transformer,Beam Search 前言 在前文...中介绍了Transformer在预测阶段...[作者空间]
关键词:Transformer,注意力机制,Decoder解码器 前言 在之前系列的篇章的已经介绍了Transfo...[作者空间]
摘要:CRF,条件随机场,序列标注,命名实体识别 内容摘要 NER任务简介 NER中引入CRF的目的 CRF中的学...[作者空间]
关键词:Bert,预训练模型,微调 内容摘要 Bert源码工程介绍 MRPC任务介绍 输入层,数据格式要求 Ber...[作者空间]
摘要:Bert,Transformer,预训练模型 内容摘要 Bert起源背景简介 Bert、Transforme...[作者空间]
关键词:Transformer,位置编码 内容提要 位置编码的目的 位置编码的多种方式 从代码理解sin-cos位...[作者空间]
关键词:Transformer,残差连接 内容目录 残差连接的历史由来 Transformer中的残差连接 深层网...[作者空间]
关键词:Transfomer,self attention Transformer Self Attention的...[作者空间]
参考 https://www.cnblogs.com/createMoMo/p/7529885.html 数据编码...[作者空间]