成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepMind用新AI超越自己:提速200倍,在所有雅達利游戲上勝過人類

人工智能 新聞
Agent57,是DeepMind在2020年搞的一個智能體,史上首次在所有57個雅達利游戲中超過了人類基準表現(xiàn)。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

DeepMind又對雅達利游戲下手了!

這次,他們最新推出的智能體MEME,在效果不變的前提下,比兩年前的Agent57提速了200倍

圖片

Agent57,是DeepMind在2020年搞的一個智能體,史上首次在所有57個雅達利游戲中超過了人類基準表現(xiàn)。

但它有一個致命缺陷是效率低:需要近800億幀的數(shù)據(jù)訓練才能實現(xiàn)。

現(xiàn)在,MEME的出現(xiàn)完美解決了這一問題。

有網(wǎng)友看完表示:這就是真正的樣本高效吧。

圖片

話不多說,趕緊來一睹為快吧。

新的智能體:MEME

Agent57,作為首個在所有雅達利游戲中超越人類基準表現(xiàn)的智能體,性能上已足夠先進。

但問題是,要想達到這一目標,背后需要780億幀的龐大的經(jīng)驗訓練,這在時間和成本上都是一筆大開支。

因此,以Agent57為起點,DeepMind采用了一系列不同的策略,來實現(xiàn)訓練效率上的提升。

他們調(diào)查了在減少數(shù)據(jù)制度時遇到的一系列不穩(wěn)定因素和瓶頸,并提出了有效的解決方案,最后建立一個更加強大和高效的智能體:MEME。

新的MEME智能體主要針對Agent57的4個方面進行改善,分別是:

A.實現(xiàn)與罕見事件相關(guān)的學習信號的快速傳播

B.在不同的價值尺度下穩(wěn)定學習

C.改進神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

D.在快速變化的政策下使更新更加穩(wěn)健

圖片

為了達到這四個目標,DeepMind采取了以下方法,與上述四點相對應(yīng)。

A1.用在線網(wǎng)絡(luò)進行引導;

A2.有公差的目標計算;

B1.損失和優(yōu)先權(quán)歸一化;

B2.交叉混合訓練;

C1.無歸一化的軀干網(wǎng)絡(luò);

C2.帶有綜合損失的共享軀干;

D.通過策略提煉的魯棒行為。

圖片

這些方法旨在提高Agent57的數(shù)據(jù)效率,但這種效率的提高不能以犧牲終端性能為代價。

因此,為了檢驗經(jīng)過上述步驟的智能體MEME的效率和性能,研究團隊分別在2億、10億、200億、900億幀環(huán)境進行了訓練。

圖片

通過下圖可以直觀的看出,新智能體MEME在3.9億幀時就超過了人類基準,比Agent57快了兩個數(shù)量級,并且在將參數(shù)量從90B減少到1B的情況下,取得了類似的最終表現(xiàn)。

可以說相比Agent57而言,MEME既提升了效率,又保持了性能。

圖片

研究團隊

MEME的研究團隊來自DeepMind。

其中三位Adrià Puigdomènech Badia、Steven Kapturowski、Charles Blundell也是之前Agent57的論文作者。

圖片

值得一提的是,Steven Kapturowski在兩篇論文中都是一作。

他畢業(yè)于美國科羅拉多大學博爾德分校,曾在蘋果、微軟、Glassdoor等公司工作過,現(xiàn)在是DeepMind的一名高級研究工程師。

圖片

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-07-02 14:47:26

AI速通效率

2024-04-01 07:00:00

模型AI

2025-03-03 09:12:00

2021-03-03 14:15:03

人工智能

2019-10-21 07:41:40

機器人人工智能系統(tǒng)

2021-08-12 22:00:51

人工智能AI

2025-06-13 11:24:39

英偉達AI芯片

2024-03-14 11:55:21

2023-09-05 15:09:31

人工智能

2023-11-29 10:15:12

AI芯片亞馬遜英偉達

2022-08-09 09:10:31

TaichiPython

2017-06-05 10:25:43

AIAlphaGo機器學習

2019-10-22 15:19:27

AI 數(shù)據(jù)人工智能

2021-04-12 10:28:51

機器學習人工智能AI

2021-03-03 14:54:20

iPhone越獄漏洞

2019-08-12 08:43:53

GitHub代碼開發(fā)者

2022-05-13 14:56:03

人工智能DeepMind

2021-01-27 14:24:17

人工智能AI國際象棋AI

2021-01-07 14:56:55

AI 數(shù)據(jù)人工智能

2024-05-29 12:57:31

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 蜜桃毛片 | 久久久91精品国产一区二区三区 | 国产精品视频偷伦精品视频 | 亚洲视频免费观看 | 久久综合一区二区 | 日韩在线免费视频 | 福利成人 | 韩国电影久久 | 日干夜操 | 久久久一区二区三区 | 男女那个视频 | 九色91视频 | 久久久久久国产精品久久 | 操亚洲 | 日韩精品一区二区三区中文字幕 | 日韩在线精品视频 | 日本网站免费在线观看 | 亚洲综合资源 | 国产在线一区二区三区 | 久久精品国产久精国产 | 天天天天操 | 久久综合久色欧美综合狠狠 | 亚洲欧美日本在线 | 国产精品国产a级 | 91av在线免费看 | 久久久久久国产精品久久 | 作爱视频免费看 | 美女福利网站 | 天天操天天拍 | 中文字幕高清视频 | 91xh98hx 在线 国产 | 欧美日韩亚洲国产综合 | 美女131mm久久爽爽免费 | 亚洲激情网站 | 欧美一区二区三区四区视频 | 久久久精品 | 91精品中文字幕一区二区三区 | 久久久久久av| 久久精品视频一区二区三区 | 中文字幕日韩欧美一区二区三区 | 欧美三级电影在线播放 |