成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用暫停token重新訓練大模型,AI學會三思而后行

人工智能 新聞
整個研究基于一個簡單的想法:在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。這可以給模型額外的計算時間來處理更復雜的輸入。

讓ChatGPT給出答案之前多想想步驟,就能提高準確率。

那么能不能省去提示詞,直接把這種能力內化在大模型里呢?

CMU與谷歌團隊的新研究,在訓練大模型時加入暫停token來實現這一點。

圖片

實驗中,8項評測成績提升,其中SQuAD的EM得分提高18%,CommonSenseQA提高8%,GSM8k中的推理任務也提高1%。

圖片

研究者Jack Hack表示,自己不久前就提出類似假設,很高興看到它被驗證。

圖片

英偉達工程師Aaron Erickson表示,是不是和人類說話時加入“嗯嗯啊啊”是一個道理?

圖片

預訓練微調都加入暫停token

整個研究基于一個簡單的想法:

在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。

這可以給模型額外的計算時間來處理更復雜的輸入。

圖片

作者不僅在下游任務微調時引入,還在預訓練時就隨機在序列中插入,讓模型在兩階段都學習如何利用這種計算延遲。

圖片

預訓練階段,在語料庫中隨機插入一定比例的暫停token到輸入序列,進行標準的自回歸預訓練。但計算損失時會跳過暫停token的預測。

下游任務微調時,輸入中也追加一定數量的暫停 token,然后對目標序列進行自回歸預測,同時微調模型參數。

推理階段也追加相同數量的暫停token,但忽略模型輸出直到最后一個暫停token,然后開始提取答案。

實驗使用了標準的Transformer純Decoder模型,分為130M參數和1B參數兩個版本。

其中暫停token只增加了1024個參數,也就是它本身的embedding大小。

在9個不同任務上的實驗表明,僅在微調階段引入暫停token的效果并不明顯,有些任務不會提升。

但如果在預訓練和finetune階段都使用暫停token,大多數任務上都獲得顯著提升。

論文還探究了暫停token的數量、位置等關鍵超參數。發現對于不同的模型通常存在一個最優的數量。

最后作者也提出,這項工作也有不少局限性。

  • 由于暫停token增加了模型計算量,與其他方法對比是否公平還有待討論
  • 新方法需要重新預訓練,在實際應用還有一定困難
  • 對具體工作機制還缺乏深入理解
  • 推理時如果暫停token數量為0,模型表現仍然不佳

搜索引擎You.com的CEO表示,接下來是不是應該把所有提高人類認知表現的技巧都對大模型試一試?

圖片

現在已經有了“一步一步地想”和“深呼吸”。

也許下一個爆款論文就是教大模型帶著問題睡一覺或者更離譜的健康飲食、注意鍛煉。

論文地址:https://arxiv.org/abs/2310.02226

責任編輯:張燕妮 來源: 量子位
相關推薦

2018-08-08 06:49:35

云計算私有云公有云

2009-10-29 18:04:32

2011-03-29 15:53:28

數據庫管理

2015-02-26 14:10:58

部署虛擬化

2025-04-07 09:00:00

模型AI推理

2015-04-20 10:47:53

微服務容器技術PaaS

2011-02-18 10:22:30

2010-08-26 15:33:28

無線網絡

2013-09-11 11:00:59

HTML5企業

2023-10-16 13:39:00

AI智能

2025-02-18 08:00:00

2023-09-06 08:30:00

低代碼自動化開發

2010-02-01 16:39:32

Dell主板質量

2023-07-18 15:14:04

人工智能自動化

2015-04-16 16:58:39

2013-12-09 11:06:47

2014-08-20 11:17:03

2016-01-05 15:40:07

2015-08-24 13:42:58

WiFi安全

2013-09-12 10:30:46

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品日韩| 久久九九网站 | 成人精品毛片国产亚洲av十九禁 | 国产精品揄拍一区二区 | 成人在线视 | 亚洲色片网站 | 亚洲不卡在线观看 | 国产精品久久久久久久岛一牛影视 | 日一日操一操 | 超碰免费在 | 天天干天天操天天爽 | 免费精品视频一区 | 欧美日韩精品一区二区三区四区 | 91在线精品一区二区 | 亚洲一区二区中文字幕 | 精品蜜桃一区二区三区 | 91一区| 欧美一级片在线 | 中文字幕在线观看www | 久久久精品视频免费看 | 色综合色综合色综合 | 国产亚洲久 | 精品久久亚洲 | 一级毛片色一级 | 日韩精品一区二区三区老鸭窝 | 在线免费观看视频你懂的 | 四虎影视免费在线 | 久久久久久国产精品免费免费 | 久久久精品一区 | 国产精品不卡视频 | 高清黄色 | 欧美日韩精品一区二区天天拍 | 99精品一区二区三区 | 免费1区2区3区 | 狠狠干天天干 | 在线午夜| 久久精品视频12 | 综合久久久久 | 超碰av免费 | 丁香婷婷成人 | 日韩在线看片 |