成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="qiysk"></li>

<li id="qiysk"><dl id="qiysk"></dl></li>

<tfoot id="qiysk"><delect id="qiysk"></delect></tfoot>

<li id="qiysk"></li>

<abbr id="qiysk"></abbr>

<code id="qiysk"><wbr id="qiysk"></wbr></code>

<table id="qiysk"><wbr id="qiysk"></wbr></table>

<li id="qiysk"><source id="qiysk"></source></li>

<li id="qiysk"><input id="qiysk"></input></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

Transformer結構優勢 ,How Much Attention Do You Need?

發布于 2024-9-25 13:05

瀏覽

0收藏

前言

本期基于凱斯西儲大學（CWRU）軸承數據，進行 Transformer 的結構優勢進行講解，結合論文《How Much Attention Do You Need? 》，探索不同模塊對故障分類任務的影響力。

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

1 《How Much Attention Do You Need? 》

1.1 論文解析

論文提到三個觀點：

（1）Source attention on lower encoder layers brings no additional benefit (x4.2).

解釋：

Source Attention：通常指的是在編碼器（encoder）中，模型關注輸入序列的不同部分的機制。在Transformer中，編碼器的每一層都通過自注意力（self-attention）機制來處理輸入序列。
Lower Encoder Layers：指的是編碼器中的靠前或較淺的層。
結論意義：在模型的較淺層次，對源輸入進行復雜的注意力機制處理并沒有顯著的性能提升。也就是說，較低層次的編碼器主要在做基礎特征提取，而復雜的注意力模式在這些層次上未能發揮其潛力。因此，將注意力機制的復雜性集中在編碼器的更深層次可能更為有效。

（2）Multiple source attention layers and residual feed-forward layers are key (x4.3).

解釋：

Multiple Source Attention Layers：在模型中使用多個層次的注意力機制來處理源輸入序列。
Residual Feed-Forward Layers：在每個注意力層之后，通常會有一個殘差結構的前饋神經網絡（Feed-Forward Neural Network），這對于學習復雜的特征變換是重要的。
結論意義：這表明，對源輸入進行多層次的注意力處理，以及在每個注意力層之后使用殘差前饋層，是模型性能的關鍵因素。這可能是因為多層次的關注機制允許模型在不同的抽象層次上理解輸入序列，并通過殘差連接有效地訓練深層模型。

（3）Self-attention is more important for the source than for the target side (x4.4).

解釋：

Self-Attention：一種注意力機制，輸入的每個元素（如序列中的一個詞）對自身序列中的其他元素進行關注，以捕捉序列內部的相關性。
Source Side vs. Target Side：在序列到序列模型中，源指的是輸入序列（例如，翻譯任務中的源語言），而目標指的是輸出序列（例如，翻譯任務中的目標語言）。
結論意義：這個結論表明，自注意力機制在源輸入序列的處理過程中比在目標輸出序列生成過程中更為重要。這可能是因為在源輸入的編碼階段，理解和建模句子內部的長程依賴性和上下文關系至關重要，而在目標側，可能更多依賴上下文和已生成的部分來預測下一個元素。

2.1 具體結構探究

（1）雙向 RNN 替換多頭注意力

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

RNN嵌入Transformer后，上圖展示了對原生RNN逐步加入Transformer的各個構件后的效果。從上面的逐步對比過程可以看到，原生RNN的效果在不斷穩定提升。但是原本的Transformer相比，性能仍然有差距。

（2）CNN 替換多頭注意力

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

上圖展示了對CNN進行不斷加入Transformer的各個構件后的過程以及其對應效果。同樣的，性能也有不同幅度的提升。但是也與原本的Transformer性能存在一些差距。

（3）論文結論：

我們發現基于RNN的模型受益于多源注意機制和剩余前饋塊。另一方面，基于CNN的模型可以通過層歸一化和前饋塊來改進。這些變化使基于RNN和CNN的模型更接近Transformer。此外，我們還展示了可以成功地組合體系結構。

我們發現自我注意在編碼器方面比在解碼器方面重要得多，即使沒有自我注意的模型也表現得非常好。對于我們評估的數據集，在大多數情況下，編碼器側具有自關注的模型以及解碼器側具有RNN或CNN的模型與Transformer模型相比具有競爭力。

2 結合故障診斷進行探索

2.1 探索目標分析

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

根據上述結論，編碼器結構在特征提取過程中扮演著重要角色，而編碼器結構又由多頭注意力、前饋神經網絡、殘差連接等部分組成。結合故障診斷任務，我們可以鎖定2個研究對象：

編碼器整體結構
多頭注意力機制

2.2 多頭注意力機制的優勢

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

（1）多角度關注：

不同的頭可以從不同的角度和細粒度的層次來關注輸入序列的不同部分，從而捕捉更豐富的特征和關系。

（2）提高模型的表達能力：

多頭機制使得模型可以在不同的子空間中并行學習，這增強了其表達復雜關系和模式的能力。

（3）穩定訓練：

通過縮放點積和多頭的并行計算，模型能更好地處理長序列并穩定梯度。

3 軸承故障數據的預處理

3.1 導入數據

參考之前的文章，進行故障10分類的預處理，凱斯西儲大學軸承數據10分類數據集：

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

train_set、val_set、test_set 均為按照7：2：1劃分訓練集、驗證集、測試集，最后保存數據

3.2 故障數據預處理與數據集制作

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

4 編碼器整體結構的實驗對比

4.1 對比模型為：

模型 A :Transformer 編碼器結構
模型 B :多頭注意力機制

4.2 西儲大學十分類數據集實驗對比

（1）模型 A：

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

模型評估：

準確率、精確率、召回率、F1 Score

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

（2）模型 B：

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

模型評估：

準確率、精確率、召回率、F1 Score

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

4.3 東南大學齒輪箱軸承故障-五分類數據集實驗對比

（1）模型 A：

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

模型評估：

準確率、精確率、召回率、F1 Score

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

（2）模型 B：

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

模型評估：

準確率、精確率、召回率、F1 Score

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

5 實驗對比結果分析

Transformer結構優勢 ,How Much Attention Do You Need?-AI.x社區

通過兩個數據集的對比實驗，我們可以發現，Transformer 編碼器層在故障信號分類任務上取得了不錯的效果，但是僅用多頭注意力機制分類效果有一定程度的下降，證明Transformer 編碼器整體結構在故障信號分類任務上的優越性！大家還可以進一步細致的探索結構中的其他部分。

本文轉載自??建模先鋒??，作者：小蝸愛建模 ????

標簽

贊

收藏

回復

舉報

回復

相關推薦

小到用iPhone就能跑起來，網友：Good data is all you need!

51CTO技術棧 ? 3130瀏覽 ? 0回復
用 LLMs 做數據標注：優勢、局限與實操指南

Baihai_IDP ? 5262瀏覽 ? 0回復
Self-Attention在時間序列預測中有效嗎？新Transformer架構效率效果雙提升

海因斯DK ? 5060瀏覽 ? 0回復
15大結構梳理CNN網絡的發展

angel ? 2538瀏覽 ? 0回復
向量——人工智能技術的基石結構

AI探索時代 ? 4683瀏覽 ? 1回復
多模態AI：概念、用例、優勢、挑戰及發展未來

51CTO內容精選 ? 4412瀏覽 ? 0回復
LLM 推理的 Attention 計算和 KV Cache 優化：PagedAttention、vAttention 等

amei2000go ? 9863瀏覽 ? 0回復
Binary Block Masking：加快稀疏 Attention 的一種新方法

amei2000go ? 4492瀏覽 ? 0回復
MixAttention：跨層 KV Cache 共享 + 滑動窗口 Attention

amei2000go ? 3371瀏覽 ? 0回復
Sample Packing：長序列 LLM 訓練的 Attention 問題及優化

amei2000go ? 3069瀏覽 ? 0回復
Agent實戰-JSON結構化智能

ermulong ? 2487瀏覽 ? 0回復
使用結構化和非結構化數據增強大型語言模型(LLM)

Halo咯咯 ? 2664瀏覽 ? 0回復
什么是大模型、特點、優勢。大模型與AIGC的關系

parson2000 ? 3612瀏覽 ? 0回復
為什么Transformer難以學會搜索？一項新研究揭示關鍵原因 | 從優勢到局限：大型語言模型的潛力與邊界

sbf_2000 ? 2389瀏覽 ? 0回復
大模型神經網絡之注意力機制——attention

AI探索時代 ? 2245瀏覽 ? 0回復
故障診斷一區直接寫，圖卷積+BiGRU-Attention 并行診斷模型

Tang_Lan ? 2837瀏覽 ? 0回復
CEEMDAN + SSA-TCN-BiLSTM-Attention預測模型

Tang_Lan ? 2672瀏覽 ? 0回復
xLSTM：拳打Transformer，腳踢Mamba？！

魯班模錘1 ? 2430瀏覽 ? 0回復
顛覆傳統渲染：實時云渲染技術的五大核心優勢與產業變革

AI算力補給站 ? 1781瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

一區直接寫！CEEMDAN分解 + Informer-LSTM +XGBoost組合預測模型 8天前發布
我們一起聊聊基于CNN-BiLSTM-Attention的回歸預測模型！ 2025-06-13 06:27:37發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

圖像編輯革命！FLUX.1 Kontext [dev]震撼開源：挑戰GPT-4o的圖像編輯 0回復

上一篇：多模態-故障診斷 | 大核卷積開啟視覺新紀元!

下一篇：我們一起聊聊基于時空特征提取的并行預測模型

社區精華內容

目錄

主站蜘蛛池模板：免费视频一区二区 | 在线观看中文字幕一区二区 | 欧美一区二区三区国产 | 99国产精品久久久 | 久久久免费观看视频 | 国产精品欧美一区二区三区不卡 | 一级免费视频 | 国产伦精品一区二区三区高清 | 国产区精品 | 欧美日韩中文在线 | 欧美小视频在线观看 | 中文字幕国产 | www.亚洲 | 日韩在线免费播放 | 欧美中文字幕一区 | 色爱综合网| 性一交一乱一透一a级 | 国产成人99久久亚洲综合精品 | 久久av综合| 最新中文字幕在线播放 | 色五月激情五月 | av福利网 | 成人在线免费看 | 成人免费一区二区三区视频网站 | 亚洲视频一区在线观看 | 免费av手机在线观看 | 日韩在线精品强乱中文字幕 | 国产在线精品一区二区三区 | 九色综合网 | 欧美一区二区三区在线看 | 国产精品一区二区久久 | 亚洲视频自拍 | 国内精品99 | 久久99精品久久久久蜜桃tv | 国产在线永久免费 | 99精品免费久久久久久日本 | 一区二区中文 | 日韩精品久久一区 | 久草免费视 | 美女天堂| 日韩免费视频一区二区 |

<bdo id="yikco"></bdo>

<bdo id="yikco"><source id="yikco"></source></bdo>

<button id="yikco"></button>

<tfoot id="yikco"><delect id="yikco"></delect></tfoot>

<button id="yikco"><input id="yikco"></input></button>

<abbr id="yikco"></abbr>

<rt id="yikco"></rt>