成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

LeCun發布最新世界模型:首次實現16秒連貫場景預測,具身智能掌握第一視角!還打臉用了VAE

人工智能 新聞
名叫PEVA模型,新突破是讓具身智能體學會這人類一樣的“預判能力”,首次實現16秒連貫場景預測。怎么說呢?就像人類伸手時會預判手臂進入視野的角度、走路時會提前觀察腳下路徑,LeCun團隊的最新模型,可以讓機器人實現這樣的能力。

LeCun在干嘛呢?

就在扎克伯克親自帶隊Meta的AI項目,千億薪酬挖得硅谷人心浮動之際。Meta在AI領域最負盛名的大佬、圖靈獎得主、深度學習三巨頭之一的Yann LeCun,卻幾乎聲量全無,他沒有參與LLM基礎模型的研發,也開始在社交網絡上消停了。

LeCun是要離開Meta了嗎?

不不不。他可能只是在憋自己想追逐的大招,比如——世界模型。而且就在最近,LeCun團隊的世界模型新進展來了。

名叫PEVA模型,新突破是讓具身智能體學會這人類一樣的“預判能力”,首次實現16秒連貫場景預測。怎么說呢?就像人類伸手時會預判手臂進入視野的角度、走路時會提前觀察腳下路徑,LeCun團隊的最新模型,可以讓機器人實現這樣的能力。

該模型通過結構化動作表示將人體48維關節運動學數據與條件擴散Transformer結合。

利用VAE編碼視頻幀、自適應層歸一化嵌入動作條件及跨歷史幀注意力機制等,實現了從全身動作預測第一視角視頻的高精度生成與長期時序連貫。

圖片

PEVA模型讓具身智能體不再依賴“上下左右”這種抽象信號進行訓練,而是以第一人稱視角的視頻+全身姿態軌跡為輸入,讓它 “模仿” 人類第一視角下的動作與感知。

圖片

通過隨機時間跳躍與跨歷史幀注意力,解決了擴散模型在長時序動作預測中的計算效率與延遲效應問題。

不僅能讓智能體精確模擬伸手取物、行走轉向等基礎動作,更實現了長達16秒的連貫場景預測

PEVA還具備智能規劃能力,能在多個動作選項中篩選出最優解,輕松完成開冰箱、抓取目標物體等復雜任務。

圖片

這項突破,或許將改寫具身智能體 “笨拙反應” 的歷史,讓它們真正學會“思考”下一步。

LeCun這是要讓AI從“人工智障”進化成“人工預判”啊!

PEVA模型: 像人類一樣 “模擬” 世界

LeCun團隊認為具身智能體世界模型應具備理解、預測和規劃等能力,能夠讓機器像人一樣 “想象” 動作后的視覺效果。

比如,在一個家庭環境中,模型要能識別出沙發、桌子等物體,以及人在房間走動、拿取物品等動作,然后基于這些感知預測未來行動軌跡。

于是,PEVA模型摒棄了抽象控制信號,采用真實物理基礎上的復雜動作空間。

關鍵創新在于用全身動作數據訓練模型,讓智能體在多樣化的現實場景中以第一人稱視角行動。

圖片

結構化動作表示

人體動作包含“整體移動”(如行走)和“關節精細運動”(如手指抓握),需用高維結構化數據同時捕捉這兩層信息。

傳統模型使用低維控制信號(如速度、轉向),無法刻畫全身關節的協同運動對視覺的影響(如伸手時肩、肘、腕的聯動如何改變視野)。

結構化動作表示的核心目標是完整捕捉人體運動中“整體動作”與“細微關節變化”的雙重信息。

技術實現

  • 運動學樹結構編碼:將人體動作表示為以骨盆為根節點的關節層級樹,包含根關節的3維平移(全局動態)和15個上半身關節的相對旋轉(每個關節3維歐拉角,共45維),總維度48維。
  • 局部坐標系轉換:將全局坐標轉換為以骨盆為中心的局部坐標,消除初始位置和朝向的影響,使動作表示具有平移 / 旋轉不變性(如無論人在房間何處,相同伸手動作的編碼一致)。
  • 歸一化與差分表示:位置參數縮放至[-1,1],旋轉參數約束在[-π,π],并以 “幀間變化量” 表示動作(如從第t幀到t+1幀的關節運動增量),強化時間動態特性。

通過“關節層級編碼+局部坐標系轉換+幀間差分”的設計,將人體全身運動轉化為模型可理解的高維結構化數據,既保留了物理真實性,又支持細粒度的視覺控制。

條件擴散Transformer架構

讓智能體學會“預測”能力的挑戰在于動作與視覺的關系具有高度非線性(如同一手臂動作在不同環境中導致的視覺變化不同),且存在延遲效應(如行走幾步后才看到新場景),需高效捕捉長距離依賴。

圖片

△PEVA模型設計

架構創新:

  • 隨機時間跳躍訓練:從長視頻中隨機采樣幀(如32秒窗口中選16幀),并將時間跳躍作為動作輸入的一部分,讓模型學習不同時間尺度下的動作動態(如快速揮手與緩慢揮手的視覺差異)。
  • 時間注意力機制:通過跨歷史幀的交叉注意力,讓當前幀生成時關注過去多幀的 “干凈” 特征(未加噪聲的真實編碼),建模動作的延遲視覺影響(如提前預測轉身后續的場景變化)。
  • 動作嵌入:將48維動作向量拼接后通過自適應層歸一化嵌入Transformer各層,動態調整網絡參數,使動作信息直接影響視覺生成過程(例如,動作中的“向前走”信號會引導模型生成視角前移的畫面)。

該模型采用自回歸擴散訓練,通過強制輸入真實歷史幀編碼,結合序列級損失函數,確保生成幀在動作驅動下保持時序連貫(如連續伸手動作的視覺軌跡平滑)。

在訓練中使用了Nymeria數據集,該數據集包含同步的第一視角視頻與全身動作捕捉數據,覆蓋了真實場景中的日常動作(如做飯、行走),提供充足的 “動作-視覺” 對兒用于訓練,避免了模擬數據的物理偏差。

訓練時隨機選擇幀子集(如16幀),通過因果掩碼并行處理序列前綴,提升長視頻訓練效率,同時覆蓋動作的短期(如手部微動)與長期(如繞桌行走)影響。

實驗成果:從“機械執行”到“智能規劃”的跨越

PEVA模型讓具身智能體實現了從人體關節運動學軌跡到第一人稱視頻的端到端預測

圖片

定量分析表明,PEVA模型在多項任務上表現優于基線模型。

在單步預測中,相比CDiT基線,PEVA的LPIPS值降低0.01,FID降低1.42,表明其生成畫面與真實畫面的視覺相似度更高、生成質量更優。

圖片

在原子動作控制實驗里,針對 “左手向上”“全身向前” 等基礎動作,PEVA的LPIPS值比CDiT基線低5%-8%,證明其能更精準地捕捉細粒度動作帶來的視覺變化。

圖片

長期視頻生成方面,在16秒長序列預測時,PEVA的FID值相比Diffusion Forcing(DF)低15%以上,生成視頻的時序連貫性顯著增強。

圖片

不僅如此,PEVA模型還能準確預測2秒內的畫面變化,支持長達16秒的視頻生成。

圖片

在給定多個可能的動作序列時,模型能通過感知相似度評估自動排除不合理選項,選擇與目標場景最匹配的動作路徑,展現出類似人類的“試錯-規劃”思維。

比如,PEVA能夠通過感知環境,排除第一行“打開水槽”和第二行“走到戶外”的動作序列,找到第三行“打開冰箱”的合理動作。

One More Thing

有意思的是,LeCun曾多次公開表達了對VAE(基于變分推斷)局限性的批評,卻在PEVA模型的預訓練中使用了VAE編碼器,并用VAE解碼器進行了圖像生成的后處理。

LeCun曾稱“VAE是生成模型中的酸黃瓜”(可以理解為“不夠好但勉強可用”),并調侃其生成樣本的模糊性。

于是,此番讓VAE扮演“視覺特征轉換器”的角色引起了網友們的討論。

Yann LeCun立場有所改變?

圖片

有人認為,盡管LeCun有時不同意某種觀點,但他支持各種新可能。

圖片

或者,VAE是一種更實用的選擇。

圖片

如果智能體真能像人類一樣預判行動,以后掃地機器人能提前 “想” 清楚路線,估計再也不會卡在桌角反復橫跳了。

你最想讓機器人幫你搞定什么事呢?

論文地址:https://arxiv.org/abs/2506.21552

項目地址:https://dannytran123.github.io/PEVA/

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-09-05 13:11:49

2025-03-07 10:24:43

2025-06-12 09:37:30

2024-06-04 09:25:51

2024-11-01 09:45:08

2025-06-12 14:32:07

AI世界模型V-JEPA 2

2024-01-22 13:17:00

AI模型

2025-02-21 09:37:00

2022-05-05 11:17:55

人工智能AI

2024-08-02 10:00:00

2025-01-09 12:39:27

2024-01-25 15:48:56

2025-04-25 02:30:00

機械臂大模型多模態

2025-03-31 09:10:00

開源模型智能體

2024-09-27 09:48:28

2025-06-13 00:03:00

2024-07-11 11:43:56

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美精品在线免费 | 成人在线精品 | 日韩在线视频免费观看 | 国产精品视频播放 | 国产综合网址 | 欧美电影免费观看 | 久久久久久九九九九九九 | 国产精品精品3d动漫 | 国产精品96久久久久久 | 91免费看片| 中文字幕日韩三级 | 国产成人免费网站 | 不卡一区二区在线观看 | 国产一区二区三区四区五区3d | 日韩在线中文 | 亚洲视频在线看 | 日韩精品视频在线免费观看 | 蜜臀久久99精品久久久久野外 | 天天干天天爱天天 | 亚洲精品免费在线观看 | 欧美日韩综合一区 | 午夜小视频在线观看 | 99国产精品99久久久久久 | 日韩欧美三级 | 久久久精品一区二区三区 | 99热这里 | 亚洲精品国产偷自在线观看 | 在线免费观看黄色 | 日韩中文一区 | 完全免费在线视频 | 久久com| 免费久久精品视频 | 日韩成人| 日韩在线国产精品 | 亚洲视频欧美视频 | 国产一级久久久久 | 国产激情一区二区三区 | 黄网站免费在线 | 国产精品高清在线 | 中文字幕亚洲视频 | 淫片一级国产 |