成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

新聞 人工智能
Facebook AI推出了全新的視頻理解架構(gòu)TimeSformer,這也是第一個完全基于Transformer的視頻架構(gòu)。視頻剪輯上限可達幾分鐘,遠遠超過當(dāng)下最好的3D CNN,且成本更低。

[[388464]]

Facebook AI推出了全新的視頻理解架構(gòu)TimeSformer,這也是第一個完全基于Transformer的視頻架構(gòu)。視頻剪輯上限可達幾分鐘,遠遠超過當(dāng)下最好的3D CNN,且成本更低。

TimeSformer即Time-Space Transformer,這是第一個完全基于Transformer的視頻架構(gòu),近年來已經(jīng)成為許多自然語言處理(NLP)應(yīng)用程序的主要方法,包括機器翻譯和通用語言理解。

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

論文鏈接:
https://arxiv.org/pdf/2102.05095.pdf

TimeSformer 在幾個難度系數(shù)比較高的動作識別基準(zhǔn)上獲得了最好的效果,包括 Kinetics-400動作識別數(shù)據(jù)集。此外,與現(xiàn)代3D 卷積神經(jīng)網(wǎng)絡(luò)(CNN)相比,TimeSformer 的訓(xùn)練速度提高了大約3倍,推理所需計算量不到原來的十分之一。這是支持需要實時或按需處理視頻的應(yīng)用程序的重要一步。

此外,TimeSformer具有可伸縮性,可以用來訓(xùn)練更長的視頻剪輯中的更大模型。這使得人工智能系統(tǒng)可以理解視頻中更復(fù)雜的人類行為,例如涉及多個原子步驟的活動(修理汽車,準(zhǔn)備食物等)。許多需要理解復(fù)雜人類行為的人工智能應(yīng)用程序都能從中獲益。

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

TimeSformer 與先進的3D 卷積神經(jīng)網(wǎng)絡(luò)在 Kinetics-400(左)和 Kinetics-600(右)動作識別基準(zhǔn)上的視頻分類精度。TimeSformer在兩個數(shù)據(jù)集上都實現(xiàn)了最高的準(zhǔn)確度。

分時空注意力

傳統(tǒng)的視頻分類模型利用3D 卷積濾波器。雖然這些濾波器在捕捉局部時空區(qū)域內(nèi)的短期模式方面有效,但是它們不能對超出其接受域的時空依賴關(guān)系進行建模。

然而,TimeSformer完全建立在Transformer使用的自注意機制之上,這使得捕獲整個視頻的時空依賴性成為可能。

為了將Transformer應(yīng)用于視頻,TimeSformer將輸入視頻解釋為從單個幀中提取的圖像塊的時空序列。這種格式類似于NLP中使用的格式,即Transformer將句子視為從單個單詞計算出來的特征向量序列。

正如NLP Transformer通過將每個單詞與句子中的所有其他單詞進行比較來推斷其含義一樣,這一模型通過將每個patch與視頻中的其他patch進行明確的比較來捕捉每個patch的語義。這使得捕獲相鄰patch之間的短期依賴以及遠距離patch之間的長期相關(guān)成為可能。

傳統(tǒng)的3D卷積神經(jīng)網(wǎng)絡(luò)由于需要在視頻的所有時空位置上使用大量的濾波器,所以計算成本也很高。

TimeSformer 通過1)將視頻分解成一小組不重疊的patch,2)應(yīng)用一種自注意的形式,避免對所有patch進行詳盡的比較,從而保持了較低的計算成本。我們稱這種方案為「分時空注意力」。這個想法是依次應(yīng)用時間注意力和空間注意力。

當(dāng)應(yīng)用時間注意力時,每個patch(例如,下圖中藍色正方形)僅與其他幀中同一空間位置的補丁(綠色的正方形)進行比較。如果視頻包含 t 幀,則只對每個patch進行 t次時間的比較。

當(dāng)應(yīng)用空間注意力時,每個patch僅與同一框架內(nèi)的patch(紅色補丁)進行比較。因此,如果 n 是每一幀中的patch數(shù),分時空注意力在每個patch中只能執(zhí)行(t + n)次比較,而聯(lián)合時空注意力窮舉法則需要(t * n)次比較。此外,該研究發(fā)現(xiàn)分時空注意不僅比聯(lián)合時空注意更有效率,而且更準(zhǔn)確。

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

TimeSformer 具有可伸縮性,可以在非常長的剪輯上運行(例如,跨越102秒時間范圍的96幀序列) ,以便執(zhí)行超長時間范圍的建模。這與目前的3D CNN有很大不同,后者僅限于處理最多幾秒的片段,而且是識別長時間活動的關(guān)鍵要求。


例如,看一段演示如何制作法式吐司的視頻。人工智能模型一次分析幾秒鐘可能會識別一些原子動作(例如,打雞蛋或者把牛奶倒進碗里)。但是對每個個體行為進行分類并不足以對復(fù)雜的活動進行分類(許多食譜都涉及到打蛋)。TimeSformer 可以在更長的時間范圍內(nèi)分析視頻,揭示原子動作之間的清晰的依賴關(guān)系(例如,將牛奶和打碎的雞蛋混合)。

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

TimeSformer 的效率使得它能夠訓(xùn)練高空間分辨率的模型(例如,幀高達560x560像素)和超長視頻(高達96幀)。這些圖表顯示視頻分類成本(TFLOPs)作為空間分辨率(左)和視頻長度(右)的函數(shù)。通過這些圖,我們可以觀察到,分散的時空注意力比耗盡的時空聯(lián)合注意力節(jié)省了大量的計算能力,特別是當(dāng)應(yīng)用于大幀或長視頻時。在實際應(yīng)用中,當(dāng)空間幀分辨率達到448像素或幀數(shù)增加到32幀時,聯(lián)合時空注意會導(dǎo)致 GPU 內(nèi)存溢出,有效地使其不適用于大幀或長視頻。

訓(xùn)練速度遠超3D CNN,提速3倍!Transformer

該圖提供了 TimeSformer 學(xué)習(xí)的自注意力熱度圖的可視化。第一行顯示原始幀,第二行根據(jù)自注意力對視頻分類的重要性(被認為不重要的像素變暗)對每個像素的顏色進行加權(quán)。如圖所示,TimeSformer 學(xué)習(xí)關(guān)注視頻中的相關(guān)區(qū)域,以執(zhí)行復(fù)雜的時空推理。

TimeSformer視頻剪輯上限可達幾分鐘

為了訓(xùn)練視頻理解模型,現(xiàn)在最好的3D CNN只能使用幾秒鐘長的視頻片段。有了TimeSformer,我們可以訓(xùn)練更長的視頻剪輯,最長可達幾分鐘。這可能極大地促進機器理解視頻中復(fù)雜的長動作的研究,這對于許多理解研究人類行為的人工智能應(yīng)用程序來說是重要的一步。

此外,TimeSformer的低推理成本是支持未來實時視頻處理應(yīng)用的一個重要步驟,如 AR/VR,或基于可穿戴攝像機拍攝的視頻智能助手。TimeSformer降低了成本,這將使更多的研究人員能夠解決視頻分析問題,從而加快這一領(lǐng)域的進展。

 

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-06-18 08:54:48

2011-10-06 13:30:45

宏碁投影儀

2012-11-26 12:51:44

木材3D打

2021-12-27 15:25:24

神經(jīng)網(wǎng)絡(luò)AI算法

2024-05-24 10:16:01

2023-12-06 13:36:00

模型數(shù)據(jù)

2011-05-26 10:05:07

優(yōu)派投影機

2024-07-03 14:29:38

2023-10-09 09:42:18

自動駕駛模型

2020-05-14 14:21:50

谷歌AI數(shù)據(jù)

2023-03-03 21:42:18

鴻蒙

2012-08-13 17:11:37

Silverlight

2011-04-26 14:21:20

3DJVC投影機

2011-08-26 14:50:23

2015-09-09 11:05:52

3d視差引導(dǎo)頁

2021-12-28 10:52:10

鴻蒙HarmonyOS應(yīng)用

2011-05-25 16:07:17

2021-03-05 16:14:08

AI 數(shù)據(jù)人工智能

2021-12-22 10:04:11

模型人工智能3D

2017-03-21 15:20:57

英特爾3D XPoint閃存
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲福利网站 | 国产一区二区久久久 | 一区二区精品 | 91青娱乐在线 | 在线小视频 | 欧美激情视频一区二区三区免费 | 欧美一区二区 | www.色.com| 91成人免费观看 | 精品福利一区 | a在线观看 | 一级a性色生活片久久毛片波多野 | 天堂在线www | 在线观看日韩av | 另类亚洲视频 | 亚洲精品国产电影 | 国产精品污www一区二区三区 | 一区二区三区免费看 | 91精品国产91久久久久久吃药 | www成人啪啪18 | 国产精品福利网站 | 91一区二区三区 | 国产一区高清 | 中文字幕一区二区三区日韩精品 | 一区二区三区四区av | 国产精品久久久久久久久久久免费看 | 色爱av| 特黄色一级毛片 | 日本黄色免费视频 | 新91视频网 | 色伊人| 国产羞羞视频在线观看 | 成人午夜激情 | xx性欧美肥妇精品久久久久久 | 99热这里只有精品8 激情毛片 | 激情欧美一区二区三区 | 黄网站涩免费蜜桃网站 | 国产va| 久久亚洲精品国产精品紫薇 | 天堂久久一区 | 亚洲精品视频在线看 |