成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

新聞 人工智能
只需第一幀圖像+邊界提示,就能將視頻中各物體“摳”出來并進行軌跡跟蹤,這就是谷歌的最新研究成果。

[[437774]]

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

只需第一幀圖像+邊界提示,就能將視頻中各物體“摳”出來并進行軌跡跟蹤

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型
注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

以上就是谷歌的最新研究成果。

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

該方法通過在視頻中引入注意力機制,成功地解決此前采用了無監督學習的多目標分割和跟蹤方法的一些不足。

現在的它,不僅可以泛化到更多樣、視覺上更復雜的視頻中,還能處理更長的視頻序列。

通過實驗還發現,相比此前的模型,谷歌這個新方法在MOVi數據集上的mIoU直接提高了近30%

為“動態摳圖”引入注意力機制

方法被命名為SAVi(Slot Attention for Video)。

而此前的無監督目標分割和跟蹤方法最大的問題,就是只能應用到非常簡單的視頻上。

為了處理視覺效果更復雜的視頻,SAVi采用弱監督學習

(1)以光流(optical flow)預測為訓練目標,并引入注意力機制;

(2)在第一幀圖像上給出初始提示(一般是框出待分割物體,或者給出物體上單個點的坐標),進行分割指導。

具體來說,受到常微分方程的“預測-校正器”方法的啟發,SAVi對每個可見的視頻幀執行預測和校正步驟。

為了描述視頻物體隨時間變化的狀態,包括與其它物體的交互,SAVi在進行光流預測時在slot之間使用自注意力

slot就是指視頻中各物體,用不同顏色區分。

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

校正階段,帶有輸入的slot-normalized交叉注意用于校正(更新)slot表示集。

然后預測器的輸出根據時間來初始化矯正器,使模型最終能夠以一致的方式隨時間跟蹤物體。

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

△ SAVi模型架構圖

在訓練中,每個視頻被分成六個6幀子序列,第一幀接收提示信號,每幀兩輪slot注意力。

在完全無監督視頻分割中,研究人員以64的batch size訓練了十萬步。

沒有提示,也能進行簡單視頻的分割和跟蹤

在CATER數據集上,測試表明,SAVi架構完全適用于無監督的物體表示學習。

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

在光流條件監督的情況下,SAVi在MOVi數據集上獲得72.1%的mIoU,比基線模型CRW和T-VOS分別高了近30%和近20%

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

SAVi在MOVi++數據集上的mIoU得分為45.9%,比T-VOS略高一點,比CRW低了5%。

另外,還可以看到,在第一幀圖像上給出質心形式的提示效果會比邊界框好一點,但區別不大。

值得注意的是,即使沒有任何提示,該方法也能分割一些具有簡單紋理的動態場景,比如在數據集Sketchy上。

注入Attention,精度漲30%!谷歌發表最新多目標“動態摳圖”模型

不過,在將SAVi完全用于現實世界里的復雜視頻時,還有一些挑戰需克服:

1、所采用的訓練方法假設在訓練時光流信息是可用的,而在真實視頻中,這不一樣有;

2、研究中所涉及的都是一些簡單物體的基本運動,現實遠比這個復雜

最后,作者表示,SAVi在分割和跟蹤方面仍然表現出色,在第一幀給出提示信息的做法也可能會衍生出各種相關的半監督方法。

論文地址:
https://arxiv.org/abs.2111.12594

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-09-02 15:25:54

技術視頻摳圖

2022-01-12 14:40:49

推薦系統模型

2024-07-02 10:04:09

2024-06-13 11:53:40

2010-07-05 09:19:35

UML動態模型圖

2022-01-27 09:45:39

建模GBDTMTGBM

2020-08-23 18:10:16

機器狗人工智能系統

2010-07-12 09:18:36

UML模型圖

2024-02-22 09:30:15

Gemma開源模型谷歌

2024-03-26 09:11:13

TensorFlow深度學習Pipeline

2020-10-23 15:29:48

iPad摳圖PC

2010-07-05 17:28:57

UML動態模型圖

2024-05-17 09:37:26

format屬性Spring

2017-02-08 17:08:32

谷歌深度學習計算圖

2011-11-25 17:24:20

跨平臺開發移動開發

2023-05-15 08:16:33

Google I/OWeb平臺

2014-10-30 13:46:10

谷歌

2023-12-07 19:01:25

2020-09-22 15:17:59

谷歌Android技術

2019-10-24 10:17:53

量子芯片網絡
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品黑人 | 日韩欧美国产精品综合嫩v 一区中文字幕 | 色婷婷综合在线观看 | 1级黄色大片 | 美女二区| 一级做a爰片久久毛片免费看 | 亚洲社区在线 | 日韩精品一区二区三区四区 | 国产精品久久久久久久久久久免费看 | 国产一区在线免费观看视频 | 丝袜毛片 | 日韩一区二区三区在线看 | 日韩一级精品视频在线观看 | 欧洲精品在线观看 | 在线免费观看毛片 | 亚洲一一在线 | 久久九九99 | 色接久久| 亚洲 中文 欧美 日韩 在线观看 | 精品国产视频 | 一区二区三区欧美 | 日本在线精品视频 | 337p日本欧洲亚洲大胆精蜜臀 | 蜜桃视频在线观看www社区 | 国产精品精品久久久久久 | 开操网 | 亚洲第一成年免费网站 | 久久精品亚洲精品国产欧美 | 成人av免费在线观看 | www.一区二区三区 | 久久精品久久久 | 国产精品 欧美精品 | 99热在线免费 | 久草新在线 | 国产a级毛毛片 | 国产一级一级毛片 | 91高清免费观看 | 91精品国产综合久久精品 | 日韩精品一区二区三区在线观看 | 看片一区 | 免费观看www |