成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

僅用7500條軌跡數(shù)據(jù)訓(xùn)練,CMU、Meta就讓機(jī)器人「上得廳堂、下得廚房」

人工智能 新聞
創(chuàng)造一個(gè)能夠在各種情境中展現(xiàn)多種技能的機(jī)器人,似乎是一個(gè)遙不可及的目標(biāo),而 RoboAgent 的出現(xiàn)或許將這個(gè)目標(biāo)拉近了一步。

僅在 7500 條軌跡數(shù)據(jù)上進(jìn)行訓(xùn)練,能夠在 38 個(gè)任務(wù)中展示 12 種多樣的操作技能,不僅限于拾取 / 推動(dòng),還包括關(guān)節(jié)對(duì)象操縱和物體重新定位,并能將這些技能推廣應(yīng)用于數(shù)百個(gè)不同的未知情境(未知物體、未知任務(wù),甚至完全未知的廚房環(huán)境),這樣的機(jī)器人夠不夠酷?

圖片

幾十年來,創(chuàng)造一個(gè)能夠在不同環(huán)境中操縱任意物體的機(jī)器人一直是一個(gè)遙不可及的目標(biāo)。一部分原因是,缺乏多樣化的機(jī)器人數(shù)據(jù)集,無法訓(xùn)練這樣的智能體,同時(shí)也缺乏能夠生成此類數(shù)據(jù)集的通用智能體。

為了突破這一困境,來自 CMU、Meta AI 的作者歷時(shí)兩年開發(fā)了一個(gè)通用的 RoboAgent。他們將重點(diǎn)放在開發(fā)一種高效的范例上,能夠在實(shí)際數(shù)據(jù)有限的情況下訓(xùn)練一個(gè)能夠獲得多種技能的通用智能體,并將這些技能推廣應(yīng)用于多樣的未知情境。

圖片

RoboAgent 由以下模塊化構(gòu)成 :

  • RoboPen - 一個(gè)采用通用硬件構(gòu)建的分布式機(jī)器人基礎(chǔ)設(shè)施,能夠長(zhǎng)期不間斷運(yùn)行;
  • RoboHive - 一個(gè)統(tǒng)一的框架,用于在模擬和真實(shí)世界操作中進(jìn)行機(jī)器人學(xué)習(xí);
  • RoboSet - 一個(gè)高質(zhì)量的數(shù)據(jù)集,代表了各種場(chǎng)景中使用日常物品的多種技能;
  • MT-ACT - 一種高效的語言條件多任務(wù)離線模仿學(xué)習(xí)框架,通過在現(xiàn)有機(jī)器人經(jīng)驗(yàn)的基礎(chǔ)上創(chuàng)建多樣的語義增強(qiáng)集合,從而擴(kuò)大了離線數(shù)據(jù)集,并采用了一種新穎的策略架構(gòu)和高效的動(dòng)作表示方法,在有限的數(shù)據(jù)預(yù)算下恢復(fù)出性能良好的策略。

RoboSet:多技能、多任務(wù)、多模態(tài)數(shù)據(jù)集

構(gòu)建一個(gè)能夠在許多不同情境下推廣的機(jī)器人智能體,首先需要一個(gè)具有廣泛覆蓋范圍的數(shù)據(jù)集。鑒于擴(kuò)大規(guī)模的努力通常會(huì)有所幫助(例如,RT-1 展示了約 130,000 條機(jī)器人軌跡的結(jié)果),因此需要在數(shù)據(jù)集有限的情況下理解學(xué)習(xí)系統(tǒng)的效率和泛化原則,低數(shù)據(jù)情境往往會(huì)導(dǎo)致過擬合。因此,作者的主要目標(biāo)是開發(fā)一種強(qiáng)大的范例,可以在低數(shù)據(jù)情境下學(xué)習(xí)可推廣的通用策略,同時(shí)避免過擬合問題。

機(jī)器人學(xué)習(xí)中的技能與數(shù)據(jù)全景。

用于訓(xùn)練 RoboAgent 的數(shù)據(jù)集 RoboSet(MT-ACT)僅包括 7,500 條軌跡(比 RT-1 的數(shù)據(jù)少 18 倍)。該數(shù)據(jù)集提前收集并保持凍結(jié)狀態(tài)。該數(shù)據(jù)集由在多個(gè)任務(wù)和場(chǎng)景中使用商品機(jī)器人硬件(Franka-Emika 機(jī)器人配備 Robotiq 夾具)進(jìn)行人類遙操作收集的高質(zhì)量軌跡組成。RoboSet(MT-ACT)在幾個(gè)不同的情境下稀疏地涵蓋了 12 種獨(dú)特技能。數(shù)據(jù)通過將日常廚房活動(dòng)(如泡茶、烘焙)分為不同的子任務(wù)來收集,每個(gè)子任務(wù)代表一個(gè)獨(dú)特的技能。數(shù)據(jù)集包括常見的拾取 - 放置技能,還包括接觸豐富的技能,如擦拭、蓋蓋子,以及涉及關(guān)節(jié)物體的技能。

MT-ACT:多任務(wù)動(dòng)作分塊 Transformer

RoboAgent 基于兩個(gè)關(guān)鍵洞察在低數(shù)據(jù)情境下學(xué)習(xí)通用策略。它利用基礎(chǔ)模型的世界先驗(yàn)知識(shí)以避免模式崩潰,并采用了一種新穎的高效策略表示,能夠攝取高度多模態(tài)的數(shù)據(jù)。

1、語義增強(qiáng):RoboAgent 通過對(duì) RoboSet(MT-ACT)進(jìn)行語義增強(qiáng),將來自現(xiàn)有基礎(chǔ)模型的世界先驗(yàn)知識(shí)注入其中。由此產(chǎn)生的數(shù)據(jù)集將機(jī)器人的經(jīng)驗(yàn)與世界先驗(yàn)知識(shí)相結(jié)合,而無需額外的人力 / 機(jī)器人成本。使用 SAM 對(duì)目標(biāo)物體進(jìn)行分割,并在形狀、顏色、紋理變化方面對(duì)其進(jìn)行語義增強(qiáng)。

2、高效策略表示:由此產(chǎn)生的數(shù)據(jù)集是嚴(yán)重多模態(tài)的,包含豐富多樣的技能、任務(wù)和情景。將動(dòng)作分塊方法適應(yīng)于多任務(wù)設(shè)置,開發(fā)了 MT-ACT 一種新穎的高效策略表示,能夠在低數(shù)據(jù)量情境中攝取高度多模態(tài)的數(shù)據(jù)集,同時(shí)避免過擬合問題。

實(shí)驗(yàn)結(jié)果

RoboAgent 比現(xiàn)有方法更具樣本效率

下圖比較了作者提出的 MT-ACT 策略表示與幾種模仿學(xué)習(xí)架構(gòu)。作者僅使用了包括物體姿態(tài)變化和部分光照變化的環(huán)境變化。與之前的研究相似,作者將此歸于 L1 泛化。從 RoboAgent 的結(jié)果,可以清楚地看到,使用動(dòng)作分塊來建模子軌跡明顯優(yōu)于所有基準(zhǔn)方法,從而更證明了作者提出的策略表示在樣本效率學(xué)習(xí)方面的有效性。

RoboAgent 在多個(gè)泛化層面上表現(xiàn)出色

上圖展示了作者在不同泛化層次上測(cè)試方法的結(jié)果。并且可視化了泛化級(jí)別,L1 表示物體姿態(tài)變化,L2 表示多樣的桌面背景和干擾因素,L3 表示新穎的技能 - 物體組合。接下來,作者展示了每種方法在這些泛化層次上的表現(xiàn)。在嚴(yán)格的評(píng)估研究中,MT-ACT 比其他方法中表現(xiàn)顯著優(yōu)異,特別是在更困難的泛化層次(L3)上。

RoboAgent 具有高度的可擴(kuò)展性

作者評(píng)估了在不斷增加的語義增強(qiáng)級(jí)別下 RoboAgent 的表現(xiàn)。并且在一個(gè)活動(dòng)(5 項(xiàng)技能)上進(jìn)行了評(píng)估。下圖顯示,隨著數(shù)據(jù)的增加(即每幀更多的增強(qiáng)),在所有泛化級(jí)別上性能顯著提升。重要的是,對(duì)于更難的任務(wù)(L3 泛化)來說,性能提升要大得多。

RoboAgent 能夠在多樣的活動(dòng)中展示其技能

圖片


圖片


圖片

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-08-21 13:31:36

2020-07-24 14:54:17

人工智能機(jī)器學(xué)習(xí)技術(shù)

2023-09-28 20:57:23

Meta人工智能聊天機(jī)器人

2022-03-10 18:40:01

機(jī)器人廚房

2024-12-19 14:44:22

2020-10-15 15:42:00

人工智能

2021-07-22 10:17:55

加密機(jī)器人加密貨幣機(jī)器人

2021-08-19 15:44:20

機(jī)器人人工智能機(jī)器學(xué)習(xí)

2015-07-28 09:36:11

機(jī)器人

2023-10-10 15:17:08

AI

2022-06-20 06:27:58

Meta人工智能AI模型

2021-08-27 10:04:53

機(jī)器人

2024-09-02 10:00:00

機(jī)器人開源

2012-03-08 09:42:16

開源軟件Linux

2015-12-10 21:49:32

IM機(jī)器人

2017-03-14 15:24:34

VR眼鏡機(jī)器人

2022-06-06 14:56:03

機(jī)器人算法模型

2024-11-04 14:35:00

AI機(jī)器人

2024-11-22 14:24:24

機(jī)器人AI

2025-04-15 09:15:00

AI機(jī)器人訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 成人亚洲视频 | 久久人人爽人人爽人人片av免费 | 亚洲男人网 | 在线看日韩av| 日韩高清不卡 | 亚洲成人三级 | 祝你幸福电影在线观看 | 九色国产| 日本一区二区视频 | 亚洲精品视频导航 | www.久久久 | 日韩中文字幕视频在线观看 | 91精品国产乱码久久久久久久久 | 粉嫩一区二区三区四区公司1 | 一区二区视频 | 不卡av在线 | 欧美日韩中 | 天天看天天操 | 日韩色图视频 | 91精品久久久久久久久久小网站 | 成人深夜福利网站 | 欧美综合在线观看 | 亚洲精品第一 | 久久一区视频 | 日韩免费一区二区 | 香蕉国产在线视频 | 日韩久久久久久久久久久 | 一级欧美一级日韩片 | 国产精品视频二区三区 | 精品国产一区二区三区免费 | 久久综合一区 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 | 99re在线| 精精精精xxxx免费视频 | 一本大道久久a久久精二百 欧洲一区二区三区 | 久久国产一区 | 九九久久精品视频 | 久亚州在线播放 | 午夜小视频在线播放 | 草草影院ccyy | 成人免费日韩 |