成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

GPT4教機器人盤轉筆,那叫一個絲滑!

人工智能
研究人員提出了一種名為 EUREKA 的新算法。EUREKA 使用 LLM 來生成和改進獎勵函數。在測試中,EUREKA 在 29 種不同的強化學習環境中達到了人類級別的性能,并在 83% 的任務中超越了人類專家設計的獎勵函數。

那個在聊天中給數學家陶哲軒帶來啟發的GPT-4,最近又開始教機器人轉筆了。

圖片

項目叫Agent Eureka,是由英偉達、賓州大學、加州理工學院和得克薩斯大學奧斯汀分校聯手研發的。他們的研究結合了 GPT-4 結構的能力和強化學習的優勢,讓 Eureka 能設計出精妙的獎勵函數。

GPT-4 的編程能力賦予 Eureka 強大的獎勵函數設計技巧。這意味著,在大部分任務中,Eureka 自己設計的獎勵方案,甚至比人類專家更出色。這讓它能完成一些人類難以完成的任務,包括轉筆、打開抽屜,盤核桃,甚至更復雜的任務,如拋接球,操作剪刀等等。

圖片圖片

圖片圖片

雖然目前這些都是在模擬環境中完成的,但這已經非常厲害了。

項目已經開源,項目地址和論文地址放在文末。

簡單總結下論文的核心要點。

論文探討了如何使用大型語言模型(LLM)來設計并優化機器學習中的獎勵函數。這是一個重要的課題,因為設計好的獎勵函數可以大大提高機器學習模型的性能,但是設計這樣的函數是非常困難的。

研究人員提出了一種名為 EUREKA 的新算法。EUREKA 使用 LLM 來生成和改進獎勵函數。在測試中,EUREKA 在 29 種不同的強化學習環境中達到了人類級別的性能,并在 83% 的任務中超越了人類專家設計的獎勵函數。

EUREKA 還成功地解決了一些以前無法通過人工設計獎勵函數解決的復雜操作任務,例如模擬「Shadow Hand」手部快速轉筆的操作。

此外,EUREKA 提供了一種新的方法,可以根據人類的反饋生成更有效、更符合人類期望的獎勵函數。

EUREKA 的工作方式包括三個主要步驟:

1. 將環境作為上下文:EUREKA 使用環境的源代碼作為上下文,從而生成可執行的獎勵函數。

2. 進化搜索:EUREKA 通過進化搜索迭代地提出和改進獎勵函數。

3. 獎勵反思:EUREKA 根據策略訓練的統計數據生成獎勵質量的文本總結,從而自動和有針對性地改進獎勵函數。

這項研究可能會對強化學習和獎勵函數設計領域產生深遠影響,因為它提供了一種新的、有效的方法來自動生成和改進獎勵函數,而且這種方法的性能在許多情況下超過了人類專家。

項目地址:https://github.com/eureka-research/Eureka

論文鏈接:https://arxiv.org/pdf/2310.12931.pdf

責任編輯:武曉燕 來源: 渡碼
相關推薦

2023-10-21 21:14:00

AI模型

2023-02-26 11:53:20

2023-10-23 13:31:37

GPT-4語言模型

2023-10-22 20:14:08

人工智能GPT-4

2023-03-16 12:14:55

2022-11-04 16:58:10

Linux環境變量

2022-10-21 17:30:26

機器人

2021-08-06 09:35:37

Python盯盤機器人編程語言

2024-10-14 09:40:00

AI機器人

2024-05-16 12:03:54

Python代碼開發

2023-06-14 11:06:35

OpenAIGPT-4

2023-05-09 15:41:03

2020-02-18 10:26:58

機器人人工智能系統

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-19 16:12:40

GPT-4AI聊天機器人人工智能

2021-01-12 12:45:16

機器人人工智能AI

2024-09-02 09:10:00

OpenAI機器人

2020-09-15 13:56:08

公眾號機器人圖靈機器人

2021-04-01 10:51:44

機器人人工智能編程

2021-11-30 10:56:43

ChatterBot機器人人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91视频网 | 国产一区91精品张津瑜 | 成人精品一区 | аⅴ资源新版在线天堂 | 日韩二区三区 | 日屁网站| 午夜国产一级片 | 国产美女自拍视频 | av在线天天| 一区二区三区在线播放 | 日本成人免费网站 | 国产伦精品一区二区三区照片91 | 自拍偷拍亚洲欧美 | 成人a在线 | 91人人视频在线观看 | 亚洲免费在线 | 在线免费毛片 | 欧美黑人国产人伦爽爽爽 | 美女久久久久 | 一区二区在线 | 精品福利在线 | 日韩免费网站 | 成人av看片| 国产一区二区三区久久久久久久久 | 亚洲精品久久久久久久久久久久久 | 亚洲成人av| 91在线网站 | 玖玖综合在线 | 欧美日韩国产综合在线 | 国产精品久久9 | 在线观看免费观看在线91 | www久久爱 | 亚洲综合一区二区三区 | 欧美成年网站 | 国产精品久久久久影院色老大 | 高清视频一区二区三区 | 国产视频二区 | 韩日精品一区 | 天天干在线播放 | 国产夜恋视频在线观看 | 一区二区三区中文字幕 |