成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ICLR 2025 | 機器人安燈泡、切東西都能拿捏,可操控軌跡跟蹤的DexTrack來了

人工智能 新聞
賦予機器人像人一樣的靈巧操控技能是通往未來終極具身智能的重要一步。如何讓一個具身智能體獲得廣泛的靈巧操控技能一直是具身智能領(lǐng)域的一個重要問題。

現(xiàn)實世界的機器人距離科幻小說里的機器人世界還有多遠(yuǎn)?通用靈巧操控何時才能實現(xiàn)?朝著這一偉大的目標(biāo),研究通用靈巧操控軌跡跟蹤的 DexTrack 便應(yīng)用而生。

  • 論文地址:https://arxiv.org/abs/2502.09614
  • 代碼地址:https://github.com/Meowuu7/DexTrack
  • 項目網(wǎng)站:https://meowuu7.github.io/DexTrack/ 
  • YouTube 視頻:https://youtu.be/zru1Z-DaiWE

1. 動機

賦予機器人像人一樣的靈巧操控技能是通往未來終極具身智能的重要一步。如何讓一個具身智能體獲得廣泛的靈巧操控技能一直是具身智能領(lǐng)域的一個重要問題。靈巧操控任務(wù)復(fù)雜且多樣,之前很多工作大多專注在特定技能的獲取(如抓取或者在手里轉(zhuǎn)動)。他們大多需要對單獨的任務(wù)進(jìn)行針對性的設(shè)計,例如專門對某一種特定的任務(wù)設(shè)計對應(yīng)的獎勵函數(shù),之后根據(jù)這樣的獎勵函數(shù)訓(xùn)練策略網(wǎng)絡(luò)來解決對應(yīng)的問題。這些難以遷移到不一樣的任務(wù)上的 reward 設(shè)計是通往通用操控技能的一個阻力。

所以為了實現(xiàn)通用的靈巧操控技能,我們首先需要任務(wù)表示層面的統(tǒng)一。此外,靈巧操控技能涉及到復(fù)雜的和隨時間變化的手 - 物接觸,復(fù)雜的物體運動軌跡。再考慮到對使用一個操控策略解決不同類型的操控任務(wù)的需求,得到一個通用的靈巧操控智能體對算法本身的設(shè)計也提出了很大的挑戰(zhàn)。

為了實現(xiàn)這一目標(biāo),我們將運動規(guī)劃以及控制的問題拆解開來,將不同種的靈巧操控技能重新統(tǒng)一到一個軌跡跟蹤控制的框架下,進(jìn)一步借助于大量的人類操控物體的數(shù)據(jù)作為跟蹤的目標(biāo),通過學(xué)習(xí)一個通用的軌跡跟蹤控制器,來一定程度上解決這個問題(圖 1)。

圖片

圖 1:問題的拆解和對通用軌跡跟蹤器的期待

2. DexTrack:通用軌跡跟蹤器的學(xué)習(xí)

2.1 統(tǒng)一的軌跡跟蹤任務(wù)表示

我們將不同類型的操控任務(wù)統(tǒng)一到一個軌跡跟蹤任務(wù)來完成任務(wù)表示層面的統(tǒng)一。在每個時刻,給定機器手和物體當(dāng)前的狀態(tài),以及下一步想要達(dá)到的狀態(tài),軌跡跟蹤控制器的任務(wù)是給出機器手當(dāng)前應(yīng)該執(zhí)行的動作,從而通過執(zhí)行該動作,機器手可以運動且和物體進(jìn)行交互,使得機器手以及物體實際達(dá)到的狀態(tài)與下一步想要達(dá)到的狀態(tài)相吻合。這樣的表示方式對不同的操控任務(wù)是比較適配的。對一個任務(wù),比如將物體轉(zhuǎn)動一個角度,我們可以先規(guī)劃出來物體的運動軌跡,之后將這個任務(wù)轉(zhuǎn)化為跟蹤物體運動軌跡的軌跡跟蹤任務(wù)。

圖片

圖 2:軌跡跟蹤器的輸入和輸出

2.2 通用軌跡跟蹤器的學(xué)習(xí)方法

一個通用的軌跡跟蹤需要可以響應(yīng)各種各樣的軌跡跟蹤命令。這一多樣的軌跡空間對該軌跡跟蹤器的學(xué)習(xí)提出了更高的挑戰(zhàn)。我們提出了一個將 RL 和 IL 結(jié)合起來的方法,在 RL 訓(xùn)練的同時引入監(jiān)督信號來降低 policy 學(xué)習(xí)的難度。通過交替地使用高質(zhì)量的軌跡跟蹤數(shù)據(jù)輔助通用軌跡跟蹤控制器的學(xué)習(xí),以及借助通用軌跡跟蹤器來提高單一軌跡跟蹤演示的質(zhì)量,我們可以逐漸得到一個強大的可以跟蹤各種各樣軌跡的控制器(圖 3)。

圖片

圖 3:通用軌跡跟蹤器的訓(xùn)練方法

2.2.1 軌跡跟蹤任務(wù)獎勵函數(shù)

獎勵函數(shù)主要由三部分組成:1)物體軌跡跟蹤獎勵,2)手部軌跡跟蹤獎勵,3)手和物體的親密度獎勵。

2.2.2 通過 RL 和高質(zhì)量跟蹤演示數(shù)據(jù)來訓(xùn)練通用軌跡跟蹤器

通過在 policy 的訓(xùn)練過程中引入額外的監(jiān)督信息來降低這一通用軌跡跟蹤器學(xué)習(xí)的難度。

2.2.3 借助通用軌跡跟蹤器來提高單一軌跡跟蹤演示的質(zhì)量

我們設(shè)計了兩個策略來提高單一軌跡跟蹤演示的質(zhì)量,1)借助通用軌跡跟蹤器來初始化單一軌跡跟蹤策略的學(xué)習(xí),2) 借助 homotopy optimization 的方式,通過解決一系列的優(yōu)化任務(wù)來降低特定軌跡跟蹤任務(wù)優(yōu)化的難度(圖 4)。

圖片

圖 4:Homotopy Optimization

3. 結(jié)果

我們的方法在極具挑戰(zhàn)性的任務(wù)上達(dá)到了令人矚目的效果。同時我們也進(jìn)行了大量的真機實驗來驗證它在真實世界中的可行性。我們的機器手可以轉(zhuǎn)動并嘗試 “安裝” 一個燈泡。在 functional tool using 方面,我們也可以在手中調(diào)整一個刀使得刀可以刀刃向下來切東西,可以在手中轉(zhuǎn)動一個錘子,并使用正確的朝向來錘東西。因為獲得這些動作的人手軌跡比較困難,我們通過只跟蹤物體軌跡來實現(xiàn)這些效果。這也證明了我們的方法可以拓展到稀疏物體軌跡跟蹤的應(yīng)用上。

圖 5:Real World 結(jié)果展示(Part 1)

以下是更多的真機實驗展示。

圖 6:Real World 結(jié)果展示(Part 2)

在 simulator 中,我們對這些包含復(fù)雜的物體的運動軌跡,精巧的微轉(zhuǎn),以及非常細(xì)的難以抓起來的物體仍然是有效的。

圖 7:Isaac Gym 中的不同方法的比較

此外,homotopy optimization 可以有效地提高軌跡跟蹤的效果。

圖 8:Homotopy Optimization 的有效性

我們的研究對運動軌跡中的噪聲比較魯棒,也可以泛化到從來沒有見過的物體的種類以及運動的類別上。

圖 9:Robustness

更多的結(jié)果:

圖 10:更多的結(jié)果

開源代碼:https://github.com/Meowuu7/DexTrack

更多的動畫演示和相關(guān)信息可見項目網(wǎng)站:https://meowuu7.github.io/DexTrack/

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2020-03-05 20:37:08

工業(yè)4.0機器人工業(yè)物聯(lián)網(wǎng)

2024-11-25 19:04:21

2020-04-09 09:56:55

機器人導(dǎo)航框架

2020-07-24 14:54:17

人工智能機器學(xué)習(xí)技術(shù)

2011-06-01 11:16:25

高拍儀首測

2021-06-07 08:28:26

人工智能AI機器人

2023-12-29 09:50:51

智能機器人人工智能

2025-05-07 13:48:48

AIGC生成機器人

2020-10-15 15:42:00

人工智能

2023-06-25 10:14:46

智能機器人人工智能

2018-09-29 16:16:43

微軟機器人Windows

2020-05-26 10:19:11

機器人人工智能系統(tǒng)

2015-12-10 21:49:32

IM機器人

2015-08-04 14:49:37

物聯(lián)網(wǎng)

2021-07-22 10:17:55

加密機器人加密貨幣機器人

2024-09-02 10:00:00

機器人開源

2021-08-19 15:44:20

機器人人工智能機器學(xué)習(xí)

2015-07-28 09:36:11

機器人

2015-09-29 10:13:34

物聯(lián)網(wǎng)機器人
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久中文字幕视频 | 欧美综合国产精品久久丁香 | 亚洲精品自在在线观看 | 国产综合精品一区二区三区 | 亚洲视频二 | 国产在线观看一区二区 | 国产黄色在线观看 | 不卡一区| 欧美久久久久久久 | 日本又色又爽又黄的大片 | 精品视频一区二区 | 国产高清视频一区二区 | 久久久久无码国产精品一区 | 国产99久久精品一区二区永久免费 | 亚洲欧美在线观看 | 日韩电影在线一区 | 亚洲女优在线播放 | 亚洲精品在线看 | 国产精品一区二区三区久久久 | 国内精品一区二区三区 | 欧美成人精品一区二区男人看 | av网站免费观看 | 日本在线观看视频 | 日韩精品一区二区三区老鸭窝 | 狠狠色香婷婷久久亚洲精品 | 欧美日韩综合精品 | 日韩欧美国产精品一区二区 | 色接久久 | 三区在线观看 | 欧美在线观看一区 | 妖精视频一区二区三区 | 五月婷亚洲 | 91 在线 | 一区二区三区四区五区在线视频 | 日一区二区 | 欧美一区二区三区视频 | 亚洲 精品 综合 精品 自拍 | 日韩欧美大片在线观看 | 浮生影院免费观看中文版 | a级大片免费观看 | 亚洲精品一区在线观看 |