成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

GPT-4o能玩《黑神話》!精英怪勝率超人類,無強化學習純大模型方案

人工智能 新聞
AI打游戲并不是一個新鮮事了,比如AI基于強化學習方法打《星際爭霸II》已經(jīng)可以擊敗人類職業(yè)高手。

AI玩黑神話,第一個精英怪牯護院輕松拿捏啊。

圖片

有方向感,視角也沒有問題。

圖片

躲閃劈棍很絲滑。

圖片

甚至在打鴉香客和牯護院時,AI的勝率已經(jīng)超過人類。

圖片

而且是完全使用大模型玩,沒有使用強化學習

阿里巴巴的研究人員們提出了一個新型VARP(視覺動作角色扮演)智能體框架。

它能直接將游戲截圖作為輸入,通過視覺語言模型推理,最終生成Python代碼形式的動作,以此來操作游戲。

以玩《黑神話·悟空》為例,該智能體在90%簡單和中等水平戰(zhàn)斗場景中取勝。

,時長07:00

GPT-4o、Claude 3.5都來迎戰(zhàn)

研究人員以《黑神話·悟空》為研究平臺,一共定義了12個任務,75%與戰(zhàn)斗有關。

圖片

他們構建了一個人類操作數(shù)據(jù)集,包含鍵鼠操作和游戲截圖,一共1000條有效數(shù)據(jù)。

每個操作都是由原子命令的各種組合組成的序列。原子命令包括輕攻、閃避、重攻擊、回血等。

圖片


然后,他們提出了VARP智能體框架。

主要包含動作規(guī)劃系統(tǒng)和人類引導軌跡系統(tǒng)。

其中動作規(guī)劃系統(tǒng)由情境庫、動作庫和人類引導庫組成,利用 VLMs 進行動作推理和生成,引入分解特定任務的輔助模塊和自我優(yōu)化的動作生成模塊。

人類引導軌跡系統(tǒng)利用人類操作數(shù)據(jù)改進智能體性能,對于困難任務,通過查詢?nèi)祟愐龑飓@取相似截圖和操作,生成新的人類引導動作。

圖片

同時VARP還包含3個庫:情景庫、動作庫和人工引導庫。

這些庫中存儲了agent自我學習和人類指導的內(nèi)容,可以進行檢索和更新。

動作庫中,“def new_func_a()”表示動作計劃系統(tǒng)生成的新動作,“def new_func_h()”表示人導軌跡系統(tǒng)生成的動作。”def pre_func()”代表預定義的動作。

動作案例研究和相應的游戲截圖。第一行和第二行中的操作是預定義的函數(shù)。第三行動作由人工制導軌跡系統(tǒng)生成。

SOAG會在玩家角色與敵人的每次戰(zhàn)斗互動后總結第四行和第五行中的新動作,并將其存儲在動作庫中。

圖片

框架分別使用了GPT-4o(2024-0513版本)、Claude 3.5 Sonnet和Gemini 1.5 Pro。

對比人類和AI的表現(xiàn)結果,可以看到小怪部分AI們的表現(xiàn)達到人類玩家水平。

到了牯護院時,Claude 3.5 Sonnet敗下陣來,GPT-4o勝率最高。

但是對于新手玩家普遍頭疼的幽魂,AI們也都束手無策了。

圖片

另外研究還提到,由于VLMs推理速度受到限制,是無法實時輸入每一幀畫面的。它只能間隔輸入關鍵幀,這也會導致AI在一些情況下錯過boss攻擊的關鍵信息。

以及由于游戲中沒有明確的道路引導且存在很多空氣墻,在沒有人類引導下,智能體也不能自己找到正確的路線。

如上研究來自阿里團隊,一共有5位作者。

圖片

后續(xù)相關代碼和數(shù)據(jù)集有發(fā)布計劃,感興趣的童鞋可以蹲下。

One More Thing

AI打游戲并不是一個新鮮事了,比如AI基于強化學習方法打《星際爭霸II》已經(jīng)可以擊敗人類職業(yè)高手。

利用強化學習方案,往往需要輸入大量對局。商湯此前訓練的DI-star(監(jiān)督學習+強化學習),就用了“16萬場錄像”和“1億局對戰(zhàn)”。

但是純大模型也能打游戲,還是很出乎意料的。在本項研究中,數(shù)據(jù)集中的有效數(shù)據(jù)為1000條。

論文地址:https://arxiv.org/abs/2409.12889

項目地址:https://varp-agent.github.io/


責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-04 08:40:00

2025-02-17 09:35:00

ChatGPT模型AI

2025-05-26 08:33:00

2025-01-06 12:46:16

模型數(shù)據(jù)訓練

2024-06-05 13:09:26

2024-06-20 10:43:15

2025-05-06 15:32:23

模型AI測試

2024-08-02 13:14:51

2024-09-06 13:00:29

2024-05-21 12:23:17

2024-06-05 08:29:35

2023-08-28 06:52:29

2024-05-20 08:40:00

2025-04-16 08:40:00

模型智能語音

2024-05-14 11:29:15

2024-10-17 14:05:34

2024-12-13 14:03:44

模型訓練AI

2024-05-15 17:34:15

2024-09-13 06:32:25

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜久久久 | 日韩精品一区二区三区中文在线 | 欧美日韩在线一区二区 | 精品福利在线 | 理论片午午伦夜理片影院 | 精品色| 日韩欧美天堂 | 日韩欧美网 | 国产精品视频免费观看 | 91av视频 | 青青草在线视频免费观看 | 成人一级黄色毛片 | 日韩精品一区二区三区视频播放 | 日韩成人在线看 | 国产乱码精品一品二品 | 国产 亚洲 网红 主播 | 成人免费视频网站在线看 | 欧美一区二区在线观看 | 日韩1区2区| 精品国产一区二区三区日日嗨 | 中文字幕在线一区 | 成人精品视频99在线观看免费 | 亚洲免费婷婷 | 91精品综合久久久久久五月天 | 亚洲视频在线看 | 福利国产 | 国产精品毛片无码 | 日日摸夜夜添夜夜添精品视频 | 91精品国产91久久久久久 | 在线观看日韩精品视频 | 成人在线小视频 | 91五月婷蜜桃综合 | 日韩午夜精品 | 欧美jizzhd精品欧美巨大免费 | 久久精品91久久久久久再现 | 精品二区视频 | 国产日韩精品在线 | 久久一视频 | 国产成人精品一区二区三区在线观看 | 精品国产一区二区三区久久久蜜月 | 欧美极品少妇xxxxⅹ免费视频 |