成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepMind“反向”搭建Transformer方法火了:由可解釋程序設(shè)計(jì)AI,項(xiàng)目已開源

人工智能 新聞
這是DeepMind針對(duì)Transformer模型設(shè)計(jì)的最新工具,被po到網(wǎng)上后爆火。

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

先搭個(gè)模型,效果好就試著解釋它,是我們常見的AI設(shè)計(jì)套路。

但,有人已經(jīng)受夠了這樣“莫名其妙”的流程——

既然人類總是試圖解釋AI模型,那為什么不能反過來,直接用看得懂的程序來設(shè)計(jì)AI模型權(quán)重呢?

這樣做出來的模型,既提升了它的可解釋性,又降低了設(shè)計(jì)架構(gòu)的復(fù)雜度。

圖片

這是DeepMind針對(duì)Transformer模型設(shè)計(jì)的最新工具,被po到網(wǎng)上后爆火:

圖片

有網(wǎng)友驚訝表示:

這真有意思。它或許是第一個(gè)能將代碼(軟件1.0)變模型(軟件2.0)的系統(tǒng)。

圖片

所以它究竟是如何實(shí)現(xiàn)的?

將可讀代碼轉(zhuǎn)變成AI權(quán)重的“編譯器”

這個(gè)將可讀性較高的代碼“翻譯”成Transformer模型的工具,名叫Tracr

具體來說,它有點(diǎn)像是一個(gè)“編譯器”,懂得將一種名叫RASP(Restricted Access Sequence Processing Language)的編程語言轉(zhuǎn)換成Transformer模型權(quán)重。

RASP,是此前在ICLR 2021一篇論文中提出的“編程語言”,專門根據(jù)Transformer架構(gòu)(編解碼器-注意力機(jī)制等)設(shè)計(jì)。

Tracr則在此基礎(chǔ)上更進(jìn)一步,不僅簡(jiǎn)單優(yōu)化了原有的RASP語言,而且能將基于RASP編寫的程序很好地轉(zhuǎn)換為Transformer模型的權(quán)重。

具體來說,Tracr會(huì)先將“編程語言”RASP轉(zhuǎn)換成“匯編語言”craft,后者表示向量空間以及其間的對(duì)應(yīng)操作,再進(jìn)一步地,將craft轉(zhuǎn)變成“機(jī)器碼”模型權(quán)重。

圖片

具體實(shí)現(xiàn)過程如下,一共分為5步:

圖片

基于它,作者們創(chuàng)建了一系列人工編寫程序的基準(zhǔn)Transformer,包括計(jì)算token頻率、排序以及Dyck-n括號(hào)識(shí)別等。

圖片

據(jù)一作介紹,Tracr最大的亮點(diǎn)在于,可以“從0開始搭建你自己的Transformer模型”。

還提出了配套壓縮方法

不過,基于Tracr打造的模型可能效率很低,因此作者們又提出了一種配套的“壓縮”方法。

基于案例來看,這種方法不僅能讓Tracr模型更高效,而且允許將D維特征壓縮到小于D維的特征空間中。

例如這是基于RASP語言編寫的程序示例:

圖片

在對(duì)模型進(jìn)行壓縮后,同樣能很好地完成原來的任務(wù),且效果相差不大:

圖片

同時(shí)作者們還觀察到,在對(duì)模型進(jìn)行壓縮后,它甚至保留了更重要的特征,學(xué)會(huì)自動(dòng)篩掉一些不重要的特征:

圖片

與此同時(shí)也能保證一個(gè)不錯(cuò)的精度:

圖片

目前對(duì)應(yīng)的Tracr模型已經(jīng)開源,感興趣的小伙伴們可以去查看一波~

作者介紹

論文作者們分別來自DeepMind和蘇黎世聯(lián)邦理工學(xué)院。

圖片

一作David Lindner,蘇黎世聯(lián)邦理工學(xué)院在讀博士生,這份工作是他在DeepMind實(shí)習(xí)期間完成,目前感興趣的研究方向是AI魯棒性、強(qiáng)化學(xué)習(xí)等。

圖片

你想好用它設(shè)計(jì)一個(gè)怎樣的Transformer模型了嗎?

論文地址:https://arxiv.org/abs/2301.05062

項(xiàng)目地址:
??https://github.com/deepmind/tracr??

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-01-17 15:25:33

模型深度學(xué)習(xí)

2010-02-22 15:06:05

Python解釋程序

2022-06-06 07:52:41

反欺詐技術(shù)AI

2021-03-12 15:38:32

DeepMindAI人工智能

2023-02-14 08:10:14

Python人工智能XAI

2024-05-28 08:00:00

人工智能機(jī)器學(xué)習(xí)

2019-05-13 09:22:21

微軟開源機(jī)器學(xué)習(xí)

2022-08-08 09:29:19

AIDeepMind

2022-02-07 15:49:15

人工智能機(jī)器學(xué)習(xí)技術(shù)

2010-07-20 09:58:59

配置Telnet服務(wù)器

2022-07-29 15:28:45

人工智能Python框架

2023-09-20 11:42:44

人工智能AI

2025-03-10 08:34:39

2022-11-04 16:23:30

AI人工智能

2013-12-12 16:30:20

Lua腳本語言

2025-01-07 00:00:00

AI訓(xùn)練數(shù)據(jù)

2022-01-06 10:21:56

自動(dòng)駕駛數(shù)據(jù)人工智能

2022-10-20 15:58:51

人工智能研究

2022-05-27 09:30:17

AI計(jì)算機(jī)自動(dòng)化

2023-02-25 10:00:19

開源項(xiàng)目小程序
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产亚洲日本精品 | 国产高清在线精品一区二区三区 | 免费观看成人性生生活片 | 国产婷婷色综合av蜜臀av | 黄色免费在线网址 | 亚洲久草视频 | 日韩免费av网站 | 在线免费观看黄视频 | 最新中文字幕久久 | av网站免费观看 | av一级 | 国产精品精品久久久 | 中文字幕亚洲视频 | 日本天堂视频在线观看 | 午夜激情影院 | www.玖玖玖 | 国产精品夜间视频香蕉 | 欧美日韩在线视频观看 | 国产一区二区三区 | 欧美日韩精品中文字幕 | 精品亚洲一区二区 | 国产在线视频在线观看 | 超碰人人人人 | 97伦理影院 | 亚洲第一免费播放区 | 国产乱码精品一品二品 | 国产婷婷| 欧美日韩在线播放 | 国产精品一区二区不卡 | 亚洲社区在线 | 欧美国产一区二区 | 999re5这里只有精品 | 成人在线视频免费看 | 亚洲精品久久久久久久久久久 | av一区二区三区 | 亚洲国产情侣 | 羞羞视频网页 | 午夜影院网站 | 中文字幕日韩一区 | 久草免费在线视频 | 久久久久久久av |