成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

更像人腦的新型注意力機(jī)制,Meta讓大模型自動(dòng)屏蔽任務(wù)無(wú)關(guān)信息,準(zhǔn)確率提高27%

人工智能 新聞
S2A通過(guò)提示詞對(duì)Transformer中的注意力機(jī)制進(jìn)行了“調(diào)節(jié)”,使模型整體上的思考方式更接近系統(tǒng)2。

關(guān)于大模型注意力機(jī)制,Meta又有了一項(xiàng)新研究。

通過(guò)調(diào)整模型注意力,屏蔽無(wú)關(guān)信息的干擾,新的機(jī)制讓大模型準(zhǔn)確率進(jìn)一步提升。

而且這種機(jī)制不需要微調(diào)或訓(xùn)練,只靠Prompt就能讓大模型的準(zhǔn)確率上升27%。

作者把這種注意力機(jī)制命名為“System 2 Attention”(S2A),它來(lái)自于2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼的暢銷書(shū)《思考,快與慢》中提到的心理學(xué)概念——雙系統(tǒng)思維模式中的“系統(tǒng)2”。

所謂系統(tǒng)2是指復(fù)雜有意識(shí)的推理,與之相對(duì)的是系統(tǒng)1,即簡(jiǎn)單無(wú)意識(shí)的直覺(jué)。

S2A通過(guò)提示詞對(duì)Transformer中的注意力機(jī)制進(jìn)行了“調(diào)節(jié)”,使模型整體上的思考方式更接近系統(tǒng)2。

有網(wǎng)友形容,這種機(jī)制像是給AI加了一層“護(hù)目鏡”。

圖片

此外,作者還在論文標(biāo)題中說(shuō),不只是大模型,這種思維模式或許人類自己也需要學(xué)習(xí)。

圖片

那么,這種方法具體是如何實(shí)現(xiàn)的呢?

避免大模型被“誤導(dǎo)”

傳統(tǒng)大模型常用的Transformer架構(gòu)中使用的是軟注意力機(jī)制——它給每個(gè)詞(token)都分配了0到1之間的注意力值。

與之相對(duì)應(yīng)的概念是硬注意力機(jī)制,它只關(guān)注輸入序列的某個(gè)或某些子集,更常用于圖像處理。

而S2A機(jī)制可以理解成兩種模式的結(jié)合——核心依然是軟注意力,但在其中加入了一個(gè)“硬”篩選的過(guò)程。

具體操作上,S2A不需要對(duì)模型本身做出調(diào)整,而是通過(guò)提示詞讓模型在解決問(wèn)題前先把“不應(yīng)該注意的內(nèi)容”去除。

這樣一來(lái),就可以降低大模型在處理帶有主觀色彩或不相關(guān)信息的提示詞時(shí)受到誤導(dǎo)的概率,從而提高模型的推理能力和實(shí)際應(yīng)用價(jià)值。

圖片

我們知道,大模型生成的答案很大程度上受到提示詞的影響,S2A也正式通過(guò)刪去其中可能造成干擾的信息來(lái)提高準(zhǔn)確率的。

舉個(gè)例子,假如我們問(wèn)大模型這樣一個(gè)問(wèn)題:

A市是X州的一座城市,周圍群山環(huán)繞,還有很多公園,這里人杰地靈,許多名人都出生于A市。

請(qǐng)問(wèn)X州B市的市長(zhǎng)Y出生在哪里?

此時(shí)GPT和Llama給出的答案都是問(wèn)題中提到的A市,但實(shí)際上Y的出生地是C市。

圖片

本來(lái)直接問(wèn)的時(shí)候,模型是可以準(zhǔn)確地答出C市的,但由于A市在提示詞中反復(fù)出現(xiàn),受到了模型的“關(guān)注”,給出的答案便也成了A。

另一種情況是,人們?cè)谔釂?wèn)時(shí)提出了“可能的答案”。

M樂(lè)隊(duì)中有沒(méi)有哪名歌手同時(shí)是一位演員,我認(rèn)為應(yīng)該是A,但我不確定。

結(jié)果大模型便開(kāi)始奉承用戶,你說(shuō)得對(duì),就是A沒(méi)錯(cuò)。但實(shí)際上這個(gè)人是B。

同樣的,如果直接問(wèn)這個(gè)人是誰(shuí),模型就可以給出正確的答案。

圖片

也正是這一特點(diǎn)讓作者想到了新的S2A機(jī)制,并設(shè)計(jì)了一套提示詞對(duì)用戶輸入進(jìn)行提煉。

圖片

篩選前后的效果,我們來(lái)具體看下:

Q:Mary擁有糖果的數(shù)量是Megan的3倍。Mary又拿了10塊糖。Max擁有的書(shū)比Mary多1000本。如果Megan有5塊糖,Mary一共有幾塊?

A:Max的書(shū)比Mary多1000本,所以Max有1000+x+10塊糖,可以列方程:
1000+3x+10=3(5)+10
……

而經(jīng)過(guò)S2A處理后的問(wèn)題變成了這樣:

Q:Mary擁有糖果的數(shù)量是Megan的3倍。Mary又拿了10塊糖。如果Megan有5塊糖,Mary一共有幾塊?
問(wèn)題(這里是Prompt中直接寫了Question):Mary一共有幾塊糖?

A:Megan有5塊,Mary有的是Megan的三倍也就是15塊,然后又拿了10塊,所以一共有25塊。

圖片

測(cè)試結(jié)果表明,相比于一般提問(wèn),S2A優(yōu)化后的準(zhǔn)確性和客觀性都明顯增強(qiáng),準(zhǔn)確率已與人工設(shè)計(jì)的精簡(jiǎn)提示接近。

具體來(lái)說(shuō),S2A把Llama 2-70B在修改版TriviaQA數(shù)據(jù)集上62.8%的準(zhǔn)確度提高到了80.3%,提高了27.9%,客觀性也從2.23分(滿分5分)提高到了3.82,還超過(guò)了人工精簡(jiǎn)的提示詞。

圖片

魯棒性方面,測(cè)試結(jié)果表明,無(wú)論“干擾信息”是正確或錯(cuò)誤、正面或負(fù)面,S2A都能讓模型給出更加準(zhǔn)確客觀的答案。

圖片

進(jìn)一步的實(shí)驗(yàn)結(jié)果顯示,S2A方法對(duì)干擾信息的刪除是必要的,因?yàn)閱渭兏嬖V模型忽略無(wú)效信息并不能顯著提高(甚至還可能降低)準(zhǔn)確率。

圖片

從反面看,只要將原始的干擾信息隔離,對(duì)S2A的其它調(diào)整都不會(huì)顯著降低它的效果。

圖片

One More Thing

其實(shí),通過(guò)注意力機(jī)制的調(diào)節(jié)改進(jìn)模型表現(xiàn)一直是學(xué)界的一項(xiàng)熱點(diǎn)話題。

比如前些時(shí)候推出的“最強(qiáng)7B開(kāi)源模型”Mistral,就利用了新的分組查詢注意力模式。

谷歌的研究團(tuán)隊(duì),也提出了HyperAttention注意力機(jī)制,解決的是長(zhǎng)文本處理的復(fù)雜度問(wèn)題。

……

而具體到Meta采用的“系統(tǒng)2”這種注意力模式,AI教父Bengio更是指出:

從系統(tǒng)1向系統(tǒng)2的過(guò)渡,是走向AGI的必經(jīng)之路。

論文地址:https://arxiv.org/abs/2311.11829

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-11-28 13:37:43

語(yǔ)言模型LLM

2024-06-28 08:04:43

語(yǔ)言模型應(yīng)用

2023-10-14 13:09:53

谷歌模型

2023-09-25 10:04:37

模型AI

2016-01-27 13:37:53

機(jī)器學(xué)習(xí)數(shù)據(jù)模型算法

2023-05-05 13:11:16

2024-12-09 00:00:10

2023-10-19 08:30:56

模型搜索

2024-07-15 00:30:00

MetaAI 模型大語(yǔ)言模型

2024-04-03 14:31:08

大型語(yǔ)言模型PytorchGQA

2024-12-17 14:39:16

2018-08-26 22:25:36

自注意力機(jī)制神經(jīng)網(wǎng)絡(luò)算法

2024-07-01 12:17:54

2023-10-14 17:24:49

2023-10-26 08:40:15

模型隱私推理

2020-09-14 14:10:04

開(kāi)發(fā)技能代碼

2023-11-24 12:36:00

模型訓(xùn)練

2025-06-05 02:15:00

Mamba視覺(jué)網(wǎng)絡(luò)

2024-12-05 16:19:14

2024-09-19 10:07:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品精品视频一区二区三区 | 久久不卡日韩美女 | 中文字幕一区二区三区日韩精品 | 91在线精品视频 | 午夜精品一区二区三区在线播放 | 狠狠av| 亚洲精品一区二区 | 亚洲精品一区二区在线观看 | 99re视频在线 | 欧美日韩国产三级 | 国产在线观看一区二区三区 | 久久9视频 | 91精品国产综合久久精品图片 | 久久精品 | 毛片毛片毛片毛片 | 亚洲国产欧美在线 | av天天看 | 久久精品16 | 日韩在线成人 | 一级看片免费视频囗交动图 | 在线成人www免费观看视频 | 日本公妇乱淫xxxⅹ 国产在线不卡 | 久久av一区 | 久久国产综合 | 浴室洗澡偷拍一区二区 | 久草视频在线看 | 国产片网站 | 天天看天天操 | 亚洲精品一二三区 | 天天爽天天操 | 视频一区二区三区中文字幕 | 欧美日韩不卡合集视频 | 精品国产黄a∨片高清在线 www.一级片 国产欧美日韩综合精品一区二区 | 午夜精品视频在线观看 | 黄色a视频 | 亚洲国产成人精品久久久国产成人一区 | 欧美黄色一区 | 国产精品二区三区 | av一区二区三区四区 | 欧美日韩电影一区二区 | 亚洲国产中文字幕 |