自然语言处理—自注意机制(self-attention)

自然语言处理—自注意机制(self-attention)

作者: zidea | 来源:发表于2021-01-01 19:15 被阅读0次

自然语言处理—自注意机制(self-attention)
paper to read
transformer in cv
李宏毅自然语言处理——Self Attention
self-attention自注意力机制
自注意力机制(self-attention)——考虑全局又聚焦重
(转)注意力机制（Attention Mechanism）在自然
非侵入式Self-attention多维信息融合
self-attention
Transformer

今天是 2021 年第一天，在此祝大家新年快乐! 相关视频都发布在西瓜视频上，西瓜视频账号为 zidea。

cover.jpg

自注意力机制(Self Attention)

$\hat{g}(x) = \frac{\sum_{i=1}^n|X_i - 1 \le h|y_i}{\sum_{i=1}^n|X_i - 1 \le h|}$

$\frac{\sum_{i=1}^n (\frac{X_i - x}{h})y_i}{(\sum_{i=1}^n \frac{X_i - x}{h})}$

这里老师不错，就是学习氛围不太好
户型不错就是价格有段

$g(x) = E(y_i|X_i = x)$

观察数据集 $X_i$ 大量等于 x 的样本对应 $y_i$ 的平均值就是作为估计值

有关自注意力层应用，在原始论文中是将 self-attention 和 LSTM 结合使用，这里介绍将 self-attention 和 SimpleRNN 结合使用，其实道理都是一样的，我们主要是学习如何将 self-attention 融入到循环神经网络中。

$h_1 = \tanh(A \cdot \begin{bmatrix} x_1\\ h_0 \end{bmatrix} + b)$

在之前介绍 SimpleRNN 中，我们知道更新 $h_1$ 是通过上一个时刻和当前时刻输入 $x_1$ 一起来更新当前的隐含状态 $h_1$

$h_1 = \tanh(A \cdot \begin{bmatrix} x_1\\ c_0 \end{bmatrix} + b)$

引入自注意力机制后，我们更新隐含状态 $h_1$ 就是用当前上时刻得到 $c_0$ 来代替 $h_0$ 来和输入 $x_0$ 一起更新隐含状态 $h_1$ 的

$h_1 = \tanh(A \cdot \begin{bmatrix} x_1\\ h_0\\ c_0 \end{bmatrix} + b)$

$\alpha_i = align(h_i,h_2)$

self_attention_001.png

self_attention_002.png

self_attention_003.png

然后以此类推来更新下一个时刻隐含状态，用隐含状态 $h_1$ 后，利用 $h_1$ 和 $c_1$ 计算得到得到当前时刻的隐含状态 $h_2$ 。

self_attention_005.png

然后通过计算 $\alpha = align(h_i,h_2)$ 可以得到隐含状态 $\alpha_1,\alpha_2$

self_attention_006.png

这样我们可以使用这些权重 $\alpha_1,\alpha_2$ 和 $h_1,h_2$ 想

self_attention_007.png

self_attention_008.png

self_attention_009.png

self_attention_010.png

每一轮都会用 context 看一轮之前输入隐含状态。
自注意力机制还会关注每一个输入，

相关文章

自然语言处理—自注意机制(self-attention)
今天是 2021 年第一天，在此祝大家新年快乐! 相关视频都发布在西瓜视频上，西瓜视频账号为 zidea。自注意...
paper to read
1 NLP 1.1 Attention 《注意力机制（Attention Mechanism）在自然语言处理中的应...
transformer in cv
transformer是一种主要基于自注意力机制的深度神经网络，最初应用于自然语言处理领域。受到transform...
李宏毅自然语言处理——Self Attention
引言这是李宏毅老师讲的机器学习视频中与自然语言处理有关的，本文主要关注Self-attention。处理序列的...
self-attention自注意力机制
看代码呆了半天，实在看不懂注意力机制是怎么回事，所以研究了一下原理 self.attention计算过程 quer...
自注意力机制(self-attention)——考虑全局又聚焦重
1 自注意力机制概述有时候我们期望网络能够看到全局，但是又要聚焦到重点信息上。比如在在做自然语言处理时，句子中的...
(转)注意力机制（Attention Mechanism）在自然
关键词：注意力机制；Attention机制；自然语言处理；NLP;原文链接地址近年来，深度学习的研究越来越深入，在...
非侵入式Self-attention多维信息融合
非侵入式Self-attention多维信息融合 Bert模型自2018年提出至今依旧辉煌热度不减，其在自然语言领...
self-attention
self-attention是什么一个self-attention模块接收n个输入，然后返回n个输出。自注意力机...
Transformer
什么是Transformer Transformer是基于Self-attention注意力机制的一种网络结构，同...

网友评论

本文标题：自然语言处理—自注意机制(self-attention)

本文链接：https://www.haomeiwen.com/subject/cuwjoktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据，机器学习，人工智能

热点阅读

深度学习

大数据，机器学习，人工智能

关于我们|服务条款|联系我们|自然语言处理—自注意机制(self-attention)|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！