深度学习,机器学习,nlp
声明:转载请在标题标明转载,并添加原文链接。 简介 这篇博客的主要内容是对谷歌提出的transformer 进行论...[作者空间]
标准RNN网络 数学公式 弊端 没法恢复久远的记忆,主要原因如下 梯度消失 梯度爆炸 LSTM网络 LSTM-ce...[作者空间]