成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Transformer為什么一定要添加一個Positional Encoding模塊?

人工智能 新聞
沒有Positional Encoding的transformer架構具有置換等變性。

之前老喜歡死記硬背transformer的網絡架構,雖然內容并不復雜,但是發現這個transformer模塊中的positional encoding在死記硬背的情況之下很容易被忽略。為了更好地理解為什么transformer一定需要有一個positional encoding,簡單推了一下公式

先說結論:沒有Positional Encoding的transformer架構具有置換等變性。

證明如下:

1. 對self-attn的公式推導

圖片圖片

其中的是可訓練的權重矩陣。首先計算Query和Key之間的點積,得到注意力權重矩陣:

圖片

然后計算自注意力輸出:

圖片

2. 假設對輸入進行置換

圖片

置換后的Query, Key, Value的公式分別為:

圖片

注意力矩陣的計算則變化為:

圖片

由于P是置換矩陣,滿足=,且P=I,所以:

圖片

所以最終的輸出可以這樣寫:

圖片

這樣就可以證明,transformer架構在沒有Positional Encoding計算的情況下具有置換等變性,換句話說,輸入序列中元素的排列方式不會影響模型對它們的處理方式,只是輸出的順序相應地改變。

3. 添加Positional Encoding之后的影響

加入Positional Encoding之后,置換后的輸入為:

圖片

由于P是固定的,加入Positional Encoding之后,輸入序列的置換將導致模型的輸出發生變化,模型能夠區分不用的序列:

圖片

從公式上看,在沒有位置編碼的情況下,自注意力機制的計算只涉及輸入向量的內容,不涉及任何位置信息,且對輸入序列的置換是等變的。

加入位置編碼后,輸入向量包含了位置信息,打破了自注意力機制的置換等變性,使模型能夠對序列中的元素位置敏感。

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2021-03-05 11:02:14

iOS 14.5蘋果更新

2011-05-10 15:51:34

SEO

2022-04-24 09:54:24

ProxyReflect前端

2022-01-10 13:06:13

微服務API網關

2018-08-24 09:02:26

2017-10-16 12:52:51

2024-02-22 14:22:17

數字化轉型企業架構

2024-11-13 00:58:28

2018-07-02 08:57:27

碼農業務程序員

2024-10-10 05:00:00

2017-08-17 11:11:41

深度學習弱智能機器學習

2019-01-29 11:02:30

消息中間件Java互聯網

2022-05-26 09:24:09

volatile懶漢模式

2022-06-01 16:17:00

互聯網Web3區塊鏈

2020-12-23 13:29:15

微服務架構面試官

2019-12-31 09:43:54

微服務JavaDocker

2018-06-05 09:14:42

Redis分布式場景

2022-03-21 07:40:08

線程池Executors方式

2024-05-14 08:11:56

ReactuseState造輪子
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 秋霞在线一区 | 国产精品视频一区二区三 | 亚洲一页 | 激情综合五月 | 超碰精品在线 | av资源在线看 | 精品二| 久草免费在线视频 | 四虎影音| 日韩精品一区二区三区中文在线 | 日韩精品在线免费观看 | 波多野结衣在线观看一区二区三区 | 久久久久久久综合 | 日韩福利片 | 亚洲电影免费 | 精品国产一区二区三区性色av | 国产精品欧美一区二区三区 | 一区二区三区在线免费 | 在线不卡视频 | 国产极品91 | 欧美成人免费在线 | 性色的免费视频 | 91亚洲国产 | 狠狠涩| 久久精品国产免费高清 | 日韩视频中文字幕 | 国产午夜一级 | 国产精品久久久久久久免费大片 | 亚洲国产精品第一区二区 | 91爱啪啪| 日本黄色一级视频 | 亚洲精品美女视频 | 日韩毛片网 | 精品亚洲一区二区 | 一区二区三区高清 | 亚洲成人网在线 | 亚洲欧美一区二区三区在线 | 久久精品国产亚洲一区二区三区 | 一区二区三区欧美在线 | 91免费电影 | 天堂av免费观看 |