成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

^{<bdo id="iwiig"></bdo>}

<center id="iwiig"><table id="iwiig"></table></center>

<cite id="iwiig"><tbody id="iwiig"></tbody></cite>

<cite id="iwiig"><tbody id="iwiig"></tbody></cite>

<strike id="iwiig"><dd id="iwiig"></dd></strike>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

RegMix-用回歸任務解決大模型數據混合問題

發布于 2024-7-8 07:38

瀏覽

0收藏

寫在前面

大型語言模型在預訓練過程中，如何選取數據的混合比例（利用較少的Tokens來實現較小的Loss從而加速預訓練過程）是一個復雜和關鍵的問題。手動確認數據集中各個組成的比例是不可擴展的，并且很可能不是最優選擇。

今天給大家介紹一個用回歸任務解決大模型數據混合問題的方法-RegMix。其核心思想是，利用不同的數據混合比例先訓練多個小模型并獲取其結果，在利用這些樣本訓練一個回歸模型，再遍歷所有比例利用回歸模型找到最優的數據混合比例，最后用最優數據混合比例訓練更大的語言模型。

Paper: https://arxiv.org/abs/2407.01492
Github: https://github.com/sail-sg/regmix

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

通過訓練512個1M的小模型，擬合回歸模型，找到top64的數據混合比例，訓練1B模型，最優數據混合比例訓練的模型的驗證集loss也是最低。

方法

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

整體流程如上圖所示，

生成隨機數據混合比例，按照比例采用混合數據并訓練小模型；
利用數據混合比例作為特征值，模型訓練的目標值作為標簽，擬合回歸模型；
在模擬更大數據混合比例空間，利用回歸模型預測最佳目標值，以獲取最佳混合比例；
使用模擬出的最佳混合比例的數據訓練更大的模型。

訓練小模型時越多越好，但為了節約成本需要盡量減少小模型訓練次數，那么在初始化數據混合比例時就需要時多樣化的，并且每個數據領域需要都存在極端值，數據采用過程主要是基于Tokens（chunk-level）分布的狄利克雷分布來實現。

詳見：mixture_config/synthesize_mixture.py

同時在擬合回歸模型時，采用了線性回歸和LightGBM兩種回歸模型。

結果

數據集采用Pile dataset中不涉及版權的17個數據集，如下表所示，

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

512個1M小模型在1B Tokens訓練得到的回歸模型，與在25B Tokens數據下訓練的1B模型，排序具有97.12%的高相關性，如下表所示，

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

同時訓練次數要比訓練的總Token數要重要，更影響回歸模型的效果，并且采用LightGBM建模要比線性回歸建模要好。

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

PS：跟作者@乾神交流過，512個樣本訓練回歸模型會不會數據量太少，乾神說他們做過1024的實驗，但并回歸模型效果無明顯提高，并且從成本考慮，那么512最佳。

不同的數據混合比例對下游任務結果影響較大，在Lambada數據集上最好和最差的效果相差14.6%，如下表所示，

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

同時發現了一個與傳統理解不一致的結果，一般我們任務維基數據質量很高，是評估大型語言模型最具代表性的數據集。但實驗結果發現，網絡數據集上評估的效果，更能體現模型在下游任務上的好壞，如下圖所示，可以發現Pile-CC數據集作為驗證時損失值與下游任務的相關性更強。

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

并且RegMix可以發現各領域數據之間是如何相互作用的，數據領域之間復雜的相互作用利用人類固有經驗很難直接區分。

RegMix-用回歸任務解決大模型數據混合問題-AI.x社區

本文轉載自 ??NLP工作站??，作者：劉聰NLP

標簽

贊

收藏

回復

舉報

回復

相關推薦

Microsoft提出FILM-7B，解決大模型lost-in-the-middle問題，達到GPT-4-Turbo水平！

PaperAgent ? 4529瀏覽 ? 0回復
大模型解決實際問題的能力，大模型的產品化過程

AI探索時代 ? 2936瀏覽 ? 0回復
思維樹：利用大型語言模型深思熟慮地解決問題

AIRoobt ? 4955瀏覽 ? 0回復
簡單策略解決CTR模型訓練一輪過擬合問題

海因斯DK ? 5290瀏覽 ? 0回復
REGMIX: 作為語言模型預訓練的回歸數據配比

sbf_2000 ? 3414瀏覽 ? 0回復
詳解大規?；A模型中的幻覺問題（幻覺檢測、緩解、任務、數據集和評估指標）

angel ? 5333瀏覽 ? 0回復
大語言模型評估基準數據泄露問題分析報告

芝士AI吃魚 ? 3025瀏覽 ? 0回復
大模型面經——MoE混合專家模型總結

shizhi02 ? 3104瀏覽 ? 0回復
南大&阿里發布多模態大模型WINGS，解決基于LLM的多模態訓練災難遺忘問題

海因斯DK ? 3346瀏覽 ? 0回復
詳解大規?；A模型中的幻覺問題（幻覺檢測、緩解、任務、數據集和評估指標）

angel ? 5139瀏覽 ? 0回復
混合RAG系統，提升復雜推理任務表現

大模型自然語言處理 ? 2589瀏覽 ? 0回復
我們能完全解決GAN中的模式崩潰問題嗎？

51CTO內容精選 ? 2575瀏覽 ? 0回復
怎么解決大模型知識庫的檢索問題，RAG檢索增強之ReRank(重新排序)

AI探索時代 ? 3826瀏覽 ? 0回復
ICLR 2023 | ReAct：首次結合Thought和Action提升大模型解決問題的能力

arnoldzhw ? 5033瀏覽 ? 0回復
大模型檢索增強生成之向量數據庫的問題

AI探索時代 ? 2602瀏覽 ? 0回復
LLM解決時間序列問題之語言模型+時序模型的對齊與融合建模

海因斯DK ? 4155瀏覽 ? 0回復
你知道自然語言處理(NLP)能解決哪些問題嗎？即自然語言處理任務分類有哪些？

AI探索時代 ? 2242瀏覽 ? 0回復
詳解MMoE 模型：多任務學習中的專家混合建模與實踐【附代碼】

南夏的算法驛站 ? 4230瀏覽 ? 0回復
大型語言模型是否解決了搜索問題？

51CTO內容精選 ? 2433瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

TransDiff--最簡潔的AR Transformer + Diffusion圖像生成方法 7天前發布
遲來！解讀Qwen開源的Embedding模型中的細節！附實測結果！ 2025-06-13 07:17:37發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇：一大堆Chinese Llama3正在襲來

下一篇：數據合成方法-讓模型自己說出用了哪些指令對齊數據

社區精華內容

目錄

主站蜘蛛池模板： 99国内精品久久久久久久 | 久草欧美视频 | 国产黄色大片网站 | 欧美精品一区久久 | 国产一区久久精品 | 成人精品一区二区三区 | 亚洲欧美一区二区三区1000 | 色综合视频| 亚洲成a| 91精品国产91久久久久久吃药 | 午夜色婷婷 | 91精品国产乱码久久久久久久久 | 精品av | 羞羞视频一区二区 | 天天拍天天射 | 亚洲交性| 国产一区二区三区在线免费观看 | 欧美一区二区三区视频 | 欧美精品区 | 97人澡人人添人人爽欧美 | 亚洲精品99999 | 狠狠操你| 91精品国产日韩91久久久久久 | 日韩一区二区福利视频 | 亚洲精品福利在线 | 成人亚洲视频 | 欧美日韩国产精品一区 | 韩国电影久久 | 国产免国产免费 | 欧美4p| 国产a区 | 亚洲日韩中文字幕一区 | 在线91| 黄网站在线播放 | 蜜桃视频在线观看免费视频网站www | 国产国产精品 | 一区二区在线免费观看视频 | 中文字幕在线第二页 | 欧美一区二区三区日韩 | 成人影院在线视频 | 精品国产91乱码一区二区三区 |

<bdo id="wqyya"></bdo>

<rt id="wqyya"><acronym id="wqyya"></acronym></rt>

<code id="wqyya"><xmp id="wqyya"></xmp></code>

<button id="wqyya"><input id="wqyya"></input></button>

<cite id="wqyya"><acronym id="wqyya"></acronym></cite>