成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

機器人空間泛化也有Scaling Law!清華新國大新算法框架讓機器人操作更加魯棒

人工智能 新聞
來自清華和新加坡國立大學的團隊,發現了空間智能的泛化性規律。

在機器人空間泛化領域,原來也有一套Scaling Law!

來自清華和新加坡國立大學的團隊,發現了空間智能的泛化性規律。

在此基礎上,他們提出了一套新穎的算法框架——ManiBox,讓機器人能夠在真實世界中應對多樣化的物體位置和復雜的場景布置。

圖片

在實際測試中,ManiBox實現了34440cm3最大操作空間范圍的高效覆蓋,抓取成功率高達90%-100%。

在具身智能和機器人操作實驗室中,往往會選擇固定的setting進行實驗,在業內被稱為“完美擺放位置”

但在現實環境中,實現機器人的空間泛化,以應對多樣化的物體位置和復雜的場景布置,一直是個艱難的挑戰。

顯然,實現空間智能所需要的,絕不是只在實驗室中操作一塊極小的空間范圍內的物體。

為此,研究團隊基于發現的具身智能的空間泛化性Scaling Law,推出了ManiBox這項成果。

讓機器人走出實驗室

ManiBox是一個創新性的機器人操作算法框架,深入探索了具身智能的空間泛化性的Scaling Law,并通過大量模擬器數據和Bounding Box這樣的視覺低維特征引導,成功實現了空間泛化、背景泛化和物體泛化的抓取任務。

除了開頭展示的34440cm3空間泛化之外,ManiBox還實現了物體和背景的泛化。

物體方面,無論是蘋果、鋼杯,還是玻璃燒杯,ManiBox對各種形狀、大小的物體都能精準抓取。

同時面對各種背景挑戰,無論是不同顏色桌布、復雜桌面,還是動態光源和視頻干擾,ManiBox始終表現穩定。

除了這幾個泛化維度,ManiBox的強大適應性還讓其輕松擴展至復雜操作任務,并在真實環境中成功完成了抓取半空中物體、雜亂桌面上的物體,甚至倒水等操作。

抓取半空中物體時,ManiBox能靈活應對動態目標:

擁擠環境中,也能夠精準抓取:

還可以精細操作復雜物體的局部,比如抓取杯子的把手

除了抓取之外,通過修改teacher policy,還能實現向不同瓶子中倒水的操作,精準調整角度與力度,并實現平穩且可控的液體傾倒:

另外作者的實驗還表明,即使在視覺遮擋率高達40%或Bounding Box識別噪音高達5%的情況下,ManiBox依然展現強大的魯棒性和操作能力。

即便在黑暗環境下,檢測模型大部分時間下沒有檢測到目標物體,純靠策略的泛化性,機械臂也能精準完成抓取任務:

通過下面的這組圖片,可以看到ManiBox確實只有少數時間檢測模型檢測到了目標物體。

圖片

可以看出,ManiBox不僅能夠完成常規抓取,還能擴展到更復雜的任務,適應不同的精細操作場景,展現了出色的Sim2Real能力

并且這些動作,用戶只需輸入一個物體的prompt,ManiBox即可自動執行對應物體的抓取、傾倒等操作,顯著提升了機器人操作任務的魯棒性與靈活性。

那么,ManiBox是如何實現的呢?

基于具身智能空間泛化Scaling Law

ManiBox背后的核心思想主要在于以下兩點:

  • 一是利用規模化(scalable)、自動化的action數據生成方式,來在策略模塊上進行訓練,形成模型對action的認知,以緩解action模態數據稀缺的問題。(對應生成action的Policy)
  • 二是充分利用互聯網級別的數據量(internet-scale data),在視覺、文本模態上形成通用的模型,來提供完成任務的重要指示信息。(對應Bounding Box這樣的低維視覺特征及其背后的視覺模型)

當然更基礎的,還有作者在空間泛化上取得的理論突破。

ManiBox深入探索了具身智能的空間泛化性Scaling Law,首次揭示了操作任務中的兩大關鍵關系。

一方面,團隊發現任務的成功率與數據量呈現出米氏-曼特恩(Michaelis-Menten)動力學曲線

  • 在成功率比較低的時候,增加數據量可以顯著提升成功率;
  • 成功率達到80%-90%之后,數據量即使再繼續增加,模仿學習策略的成功率也逐漸趨于飽和,上升緩慢;
  • 數據量趨于無窮的情況下,成功率趨于100%;
  • 成功率與數據量的關系用公式表示為:success_rate= 100% * D / (K_m + D),其中D是數據量,K_m是達到50%成功率所需的數據量。

圖片

另一方面,作者還發現空間泛化所需數據量與空間體積呈現冪律關系,即更多數據可顯著提升更大空間范圍內的泛化能力

  • 如果要擴展到x倍的空間體積,那么數據量需要擴展大約x^0.35倍;
  • 在文中的setting中,34400cm^3相對于1cm^3,前者空間泛化所需的數據量是后者的34400^0.35=38倍。

圖片

在理論的基礎之上,ManiBox通過policy generalization方法來有效解決了空間泛化性問題,確保策略能夠在多樣化的環境,即便視覺模型存在較大的不確定性中,也能表現出強大的適應性。

借助YOLO-World這樣的開集邊界框檢測模型,ManiBox精準提取多視角的低維空間信息,將復雜的高維視覺問題轉化為簡化的狀態建模問題,從而為策略訓練提供了堅實的基礎。

最終,通過訓練一個基于狀態的策略(state-based policy),實現了從仿真到真實世界的高效遷移。

同時結合隨機掩碼(random mask)技術和歷史軌跡信息,ManiBox顯著提升了策略在應對視覺噪聲和檢測失敗場景下的魯棒性,進一步加強了模型的泛化能力和在真實環境中的表現。

圖片

在訓練上,作者還采取了高效數據生成與學生策略學習相結合的模式:

  • 教師策略:通過強化學習與模仿學習相結合的框架,ManiBox可以做到2h訓練完強化學習策略,僅用一天時間 自動化采集了36,000條高質量模擬數據,涵蓋多種物體形狀、大小和空間配置;
  • 學生策略:在此數據上訓練,僅需2分鐘即可完成模型學習,達成零樣本遷移,在真實場景中高效部署;
  • 基于強化學習的操作策略,相比傳統的視覺方法可以有更強大通用性和魯棒性,比如傳統的視覺方法需要利用IK(逆運動學)求解joint position。

圖片

ManiBox的推出不僅為機器人操作任務提供了一種高效可靠的解決方案,更定義了一種 “數據驅動的空間智能” 方法,讓機器人在復雜真實場景的實用性成為可能。

它為機器人在復雜真實場景中的表現奠定了理論和技術基礎,具有廣泛的工業與家庭應用潛力。

作者預計,未來我們可以想象機器人在更多復雜任務中展現卓越表現。

作者簡介

該工作有兩位共同一作。

一位是清華大學計算機系TSAIL實驗室的二年級博士生譚恒楷(Hengkai Tan),主要研究方向是具身智能和強化學習,此前在ICML等頂級會議發表論文,還曾是全國青少年信息學奧林匹克競賽(NOI)的銀牌,全國84名,他也是RDT大模型的作者之一。

圖片

另一位是新加坡國立大學數學系大四本科生徐學舟(Xuezhou Xu),研究興趣在于具身智能和強化學習,他曾參與關于跨本體預訓練的研究項目PEAC,該研究已被NeurIPS2024接收。

圖片

PEAC提出了跨本體無監督預訓練CEURL,在多個本體上統一預訓練,從而控制多個本體快速適應下游任務,實現了真實世界機器狗不同關節失靈的運動控制。

ManiBox延續了作者此前工作的類似思想,即利用規模化、自動化的action數據生成方式來訓練策略,實現策略的泛化性。

作者發表在ICML2024上的FCNet在2023年實現了四足機器狗在真實世界極端地形的行走,包括過膝深的雪、結冰的河面、亂石、45度坡、樓梯等,同時有著更低的續航、更高的推理效率和更高的數據效率。

項目主頁:https://thkkk.github.io/manibox
論文地址:https://arxiv.org/abs/2411.01850
作者其他項目:
PEAC:https://yingchengyang.github.io/ceurl
FCNet:https://thkkk.github.io/fcnet
RDT-1B:https://rdt-robotics.github.io/rdt-robotics/

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-10-15 15:42:00

人工智能

2020-12-31 06:55:37

機器人自然語言人工智能

2021-07-22 10:17:55

加密機器人加密貨幣機器人

2021-08-19 15:44:20

機器人人工智能機器學習

2015-07-28 09:36:11

機器人

2019-01-09 10:00:51

機器人護理家政行業

2020-04-09 09:56:55

機器人導航框架

2012-03-08 09:42:16

開源軟件Linux

2015-12-10 21:49:32

IM機器人

2021-06-07 08:28:26

人工智能AI機器人

2024-11-01 09:45:08

2022-03-04 10:14:46

機器人

2021-08-05 06:54:04

回溯算法機器人

2019-01-27 15:03:52

機器人下崗智障機器人

2020-04-10 21:36:46

協作機器人物聯網機器人

2021-08-19 15:46:08

機器人人工智能機器學習

2021-01-28 19:34:49

人工智能AI機器人

2019-03-05 10:38:44

機器人人工智能系統

2022-10-21 17:30:26

機器人
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 男女污污动态图 | 一区二区三区四区国产 | 国产www在线 | 天天干天天插天天 | 一区二区在线免费观看 | 久久久久久久电影 | 中文字幕视频在线 | 国产成人午夜精品影院游乐网 | 欧美成视频 | 精品综合网 | 亚洲精品视频在线播放 | 亚洲精品乱码久久久久久9色 | 日韩不卡一区二区 | 一区二区精品在线 | www免费视频 | 日本久久久久久久久 | 欧美大片一区 | 久久中文字幕av | 日韩一区中文字幕 | 精品久久久久一区二区国产 | 亚洲精品不卡 | 一区二区三区四区在线视频 | 中文字幕在线精品 | 亚洲成人观看 | 亚洲精品68久久久一区 | 精品美女久久久久久免费 | 欧美日韩成人 | 精品久久久久久久久久久 | 久久免费视频网 | 日韩中文在线观看 | 91pao对白在线播放 | 亚洲不卡av在线 | 亚洲精品一区二区三区四区高清 | 国产精品免费一区二区三区四区 | 成人黄视频在线观看 | 日日夜夜免费精品视频 | 国产日韩欧美在线播放 | 欧美激情综合网 | 亚洲三区在线 | 欧美中文一区 | 91亚洲国产成人久久精品网站 |