成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Meta等最新研究:多token預測,提升大模型推理效率

發布于 2024-5-27 12:38
瀏覽
0收藏

GPT-4、Gemini系列、Llama-3等開閉源大模型,通常使用的是下一個token預測(Next-token Prediction)的損失函數進行預訓練。


這種方法雖然強大,但有很多局限性,例如,需要大量的訓練數據才能使模型達到人類兒童的智商,并且隨著模型參數的增大推理效率會變差。


因此,Meta、巴黎理工大學和巴黎薩克雷大學提出了一種全新訓練方法多token預測(Multi-token Prediction),在訓練的過程中要求模型在每個位置上同時預測接下來的n個Token,以提升模型推理效率,并且不會增加預訓練時間


研究人員在130億、67億、30億等多種不同參數的模型對該技術進行了綜合評估。結果顯示,130億參數模型在 HumanEval上解決問題能力提高了12%,在 MBPP上解決能力提高了17%,并且推理效率也更好。


論文地址:https://arxiv.org/abs/2404.19737

Meta等最新研究:多token預測,提升大模型推理效率-AI.x社區

多token預測架構介紹

?

為了有效實現多Token預測,研究人員設計了一種巧妙的模型架構。該架構包含一個共享的Transformer主干網絡,用于從輸入獲取上下文表示。


然后該上下文表示被并行輸入到n個獨立的輸出頭網絡中,每個輸出頭負責預測一個未來Token。在推理階段,只需使用單個下一Token預測,輸出頭即可進行自回歸生成。而其他輸出頭則可被用于加速模型的推理效率。

Meta等最新研究:多token預測,提升大模型推理效率-AI.x社區

對于訓練語料中的每個位置,模型需要使用獨立的輸出頭預測接下來的n個Token。將多Token預測作為輔助訓練任務,可以提高模型在代碼和自然語言文本方面的任務性能,而不會增加訓練時間。

Meta等最新研究:多token預測,提升大模型推理效率-AI.x社區

降低GPU內存使用

?

為了解決多token預測可能導致GPU內存使用量增加的問題,研究人員開發了一種前向和后向傳播順序,模型能夠減少在內存中同時存儲的梯度數量,從而降低了內存使用量使得訓練更加高效。


在前向傳播過程中,模型會首先通過共享主干生成潛在表示,然后按順序計算每個獨立輸出頭的前向傳播。對于每個輸出頭,計算完畢后立即進行后向傳播,并釋放該頭的中間數據,而不是等到所有輸出頭的前向傳播完成后才進行。

Meta等最新研究:多token預測,提升大模型推理效率-AI.x社區

在每個輸出頭的后向傳播中,累積梯度到共享主干,而不是在所有輸出頭計算完畢后才進行。這樣可以確保在任何時候,內存中只存在一個輸出頭的梯度。


優化推理效率

?

研究人員發現,將多token預測與自推測解碼相結合,可以進一步提升大模型的推理效率。與傳統逐個token解碼不同的是,自推測解碼允許模型一次性生成多個token,然后利用額外的輸出頭并行驗證和優化這些預測。


這種方法顯著減少了模型生成文本所需的步驟,從而加快了模型的整體推理效率并減少了對算力的消耗。

Meta等最新研究:多token預測,提升大模型推理效率-AI.x社區

研究人員在不同參數的模型實驗了該優化效果,結果顯示,比傳統的優化推理效率提升了3倍左右。


本文轉自  AIGC開放社區 ,作者: AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/I73utAzipiGH-LE6EJxaiw??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 色婷婷在线视频 | 国产一区91精品张津瑜 | 91福利在线导航 | 国产视频一二三区 | 超碰人人人| 国产欧美一区二区精品忘忧草 | 亚洲欧美精品一区 | 91精品国产综合久久久久 | 欧美老妇交乱视频 | 五月天激情综合网 | 国产精品一区二区视频 | 日韩精品网站 | 99精品欧美一区二区三区综合在线 | 国产激情精品一区二区三区 | 久久精品国产亚洲一区二区 | 欧美成人一区二区三区片免费 | 在线免费观看黄a | 久久久久久久综合 | a毛片 | 成人性生交大片免费看r链接 | 国产精品久久久久久久久久久免费看 | 日韩专区中文字幕 | 中文字幕av网站 | 欧美a级成人淫片免费看 | av在线黄 | 亚洲视频二区 | 日韩一区二区在线视频 | 中文字幕中文字幕 | 99久久久久久| 日韩av电影在线观看 | 精品不卡| 成人乱人乱一区二区三区软件 | 精品一区二区久久久久久久网站 | 国产午夜精品视频 | 九九精品网| h视频网站在线观看 | 亚洲婷婷六月天 | 亚洲精品欧美 | 人人看人人爽 | av手机在线看| 国产aⅴ爽av久久久久久久 |