成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepMind提出基于視覺的強化學習模型,十八般兵器對機器人不在話下

新聞 人工智能
人類是擅于模仿的,我們和其他動物通過觀察行為來模仿,理解它對環境狀態的感知影響,并找出我們的身體可以采取什么行動來達到類似的結果。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 人類是擅于模仿的,我們和其他動物通過觀察行為來模仿,理解它對環境狀態的感知影響,并找出我們的身體可以采取什么行動來達到類似的結果。

對于機器人學習任務來說,模仿學習是一個強大的工具。但在這類環境感知任務中,使用強化學習來指定一個回報函數卻是很困難的。

DeepMind最新論文主要探索了僅從第三人稱視覺模仿操作軌跡的可能性,而不依賴action狀態,團隊的靈感來自于一個機器人機械手模仿視覺上演示的復雜的行為。

DeepMind提出的方法主要分為兩個階段:

1、提出一種操作器無關的表示(MIR, Manipulation-Independent Representations),即不管是機械手、人手或是其他設備,保證這種表示都能夠用于后續任務的學習

2、使用強化學習來學習action策略

與操作器無關的表示

領域適應性問題是機器人模擬現實中最關鍵的問題,即解決視覺仿真和現實之間的差別。

1、 隨機使用各種類型操作器,各種仿真環境用來模擬現實世界

2、加入去除操作臂后的觀察

3、時序平滑對抗網絡(TSCN, Temporally-Smooth Contrastive Networks),相比TCN來說,在softmax交叉熵目標函數中增加了一個分布系數p,使得學習過程更加平滑,尤其是在cross-domain的情況。

使用強化學習

MIR表示空間的需求是actionable的,即可用于強化學習,表示為具體的action。

一個解決方案是使用goal-conditioned來訓練策略,輸入為當前狀態o和目標狀態g。這篇文章提出一種擴展方式,cross-domain goal-conditional policies,輸入當前狀態o和跨域的目標狀態o',最小化到達目標的行動次數。

數據和實驗

研究小組在8個環境和場景(規范模擬、隱形手臂、隨機手臂、隨機域、Jaco Hand、真機器人、手杖和人手)上進行了實驗,以評估通過未知機械手模擬無約束操作軌跡的性能。

他們還用了一些基線方法,如樸素的goal conditioned plicies (GCP)和temporal distance。

MIR 在所有測試領域都取得了最好的性能。它在疊加成功率方面的表現顯著提高,并且以100% 的分數很好地模仿了模擬的 Jaco Hand 和 Invisible Arm。

這項研究論證了視覺模仿表征在視覺模仿中的重要性,并驗證了操作無關表征在視覺模仿中的成功應用。

未來工廠中的機器人將擁有更強大的學習能力,并不局限于一種特定工具,一種特定任務。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2019-03-12 09:00:00

安全工具病毒軟件惡意軟件

2010-09-03 13:30:19

CSS

2021-04-21 14:15:08

機器人AI人工智能

2019-03-11 09:00:00

安全工具病毒軟件惡意軟件

2023-02-07 23:42:55

機器人技術識別

2023-09-21 10:29:01

AI模型

2019-04-08 18:26:49

網絡安全網絡安全技術周刊

2021-07-02 16:04:54

機器人人工智能AI

2022-01-20 09:56:33

機器人冬奧滑雪

2024-04-15 08:20:00

機器人技能

2022-11-02 14:02:02

強化學習訓練

2011-06-20 13:29:44

2021-05-07 09:18:04

CSS 文字動畫技巧

2010-04-01 15:01:26

配置無線路由器

2024-04-17 13:20:29

2024-10-29 15:20:00

強化學習模型

2022-07-24 19:24:32

機器學習預訓練模型機器人

2021-01-12 14:50:55

機器學習人工智能計算機

2024-09-05 08:23:58

2022-05-24 07:40:40

CSS逐幀動畫圖片輪播
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人久久精品 | 免费在线视频一区二区 | 日韩精品一区二区三区视频播放 | 亚洲风情在线观看 | 欧美精品一区在线 | 手机三级电影 | 欧美99久久精品乱码影视 | 三级av在线| 91麻豆蜜桃一区二区三区 | 国际精品鲁一鲁一区二区小说 | 欧美激情视频一区二区三区在线播放 | 午夜精品久久久久久久久久久久久 | 欧美在线视频a | 欧美精品久久久久 | 中文字幕 视频一区 | 欧美午夜精品久久久久免费视 | 日韩理论电影在线观看 | www.亚洲区| 黄色播放 | 国产在线一区二区三区 | 色婷婷精品 | 97av在线 | 国产福利在线播放 | 亚洲一区综合 | 国产精品久久av | 午夜日韩精品 | 91视频官网 | 超碰导航 | www.久久久久久久久久久 | 激情 婷婷 | 亚洲女人天堂成人av在线 | 亚洲乱码一区二区 | 国产999精品久久久影片官网 | 91亚洲免费 | 五月婷婷丁香 | 亚洲综合在线播放 | 国产成人精品一区二区三区四区 | 成人精品鲁一区一区二区 | 日韩伦理一区二区 | 成人精品一区二区三区中文字幕 | 国产免费一区二区 |