成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<u id="mqegt"><form id="mqegt"></form></u>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

大模型微調技巧 | 高質量指令數據篩選方法-MoDS

發布于 2024-7-16 09:11

瀏覽

0收藏

寫在前面

大家好，我是劉聰NLP。

大模型時代，指令微調已經成了算法工程師們必不可少的技能。而在指令微調過程中，我們往往會從數據數量和數據質量兩個維度來對模型進行調優。

今天給大家帶來一個新的方法-MoDS，一種面向模型的指令數據選擇方法-《MoDS: Model-oriented Data Selection for Instruction Tuning》，核心是從數據質量、覆蓋范圍、必要性三個角度來對原始數據集進行數據過濾，最終獲取對于不同模型的高質量數據集。并且相較于自動識別方法，在使用更少數據的情況下，就可以獲取更好的效果。

paper: https://arxiv.org/pdf/2311.15653.pdf
github: https://github.com/CASIA-LM/MoDS

MoDS方法

MoDS方法主要通過質量、覆蓋范圍、必要性三個指標來進行數據的篩選，其中數據質量是為了保證所選的指令數據的問題和答案都足夠好；數據覆蓋范圍是為了讓所選擇的數據中指令足夠多樣、涉及知識范圍更廣；數據必要性是選擇對于大模型較復雜、較難或不擅長的數據以填補大模型能力的空白。整體流程如下圖所示，

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

質量篩選

對于數據進行質量過濾時，采用OpenAssistant的reward-model-debertav3-large-v2模型（一個基于DeBERTa架構設計的獎勵模型）對數據進行質量打分。講原始數據的Instruction、Input、Output的三個部分進行拼接，送入到獎勵模型中，得到一個評分，當評分超過α時，則認為數據質量達標，構建一份高質量數據集-Data1。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

多樣性篩選

為了避免所選質量數據高度相似，通過K-Center-Greedy算法進行數據篩選，在最大化多樣性的情況下，使指令數據集最小。獲取種子指令數據集（Seed Instruction Data）-SID。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在該步驟中，采用BERT模型為指令數據生成句向量來計算不同數據之間的距離。

必要性篩選

不同的大型語言模型在預訓練過程中所學到的知識和具有的能力不同，因此在對不同的大型語言模型進行指令微調時，所需的指令數據也需要不同。

對于一條指令，如果給定的大型語言模型本身能夠生成較好的回答，則說明給定的大型語言模型具有處理該指令或者這類指令的能力，反之亦然，并且哪些不能處理的指令對于模型微調來說更為重要。

使用SID數據集對模型進行一個初始訓練
用訓練好的初始模型對整個高質數據集-Data1中的指令進行結果預測
利用獎勵模型對結果進行評分，當分值小于β時，說明初始模型不能對這些指令生成優質的回復，不具有處理這些類型指令的能力，獲取必要性數據集-Data2
對Data2進行多樣性篩選，獲取增強指令數據集（Augmented Instruction Data）-AID。

模型訓練

最終利用種子指令數據集和增強指令數據集一起對模型進行指令微調，獲得最終模型。

實驗結果

訓練數據

訓練數據有兩種，一種是單獨的Alpaca數據集（52k），一種時混合數據集（214k），包含HC3數據集、Alpaca數據集、Alpaca-evol-instruct數據集、Dolly-v2數據集、InstructWild數據集和LIMA數據集。

測試數據主要包含5個測試集，分別為Koala數據集（180）、WizardLM數據集（218）、Self-instruct數據集（252）、Vicuna數據集（80）和LIMA數據集（300）。

訓練超參

模型基座采用LLaMA2-7B模型，訓練過程中學習率為2e-5，warmup的比率為0.03，權重衰減為0.0，批大小為128，訓練輪數為3。在質量評價和必要性評價過程中，Alpaca數據集的α和β均設置為0.0，混合數據集的α和β分別設置為1.0和-1.0。

在模型測試過程中，采用ChatGPT和GPT4作為裁判，對模型生成結果從相關性和準確性兩個角度進行打分，每個角度的評分從1到10。在評價兩個模型勝、平、負時，當兩個角度評分都高時為勝；當兩個角度評分一高一低時為平；當兩個角度評分都低時為負。

結果分析

在Alpaca數據集中通過MoDS方法獲取1k數據的效果要優于全量數據訓練的結果，如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在Alpaca數據集中MoDS方法在選擇2k數據時，訓練效果優于基于IFD的自動選擇方法，如下表所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在混合數據及中MoDS方法獲取4k數據的效果全面優于全量數據訓練的結果，如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證指令多樣性選擇的重要性，與隨機選擇進行對比，如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證必要性篩選的重要性，與僅用種子數據訓練的模型進行對比，如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

寫在最后

大模型時代，大多數算法工程師已經變成了數據工程師，如何構造出讓模型表現更好地數據，變成了大家的日常工作，但千萬不要小看這份工作，往往細節決定成敗。

本文轉載自 ??NLP工作站??，作者：劉聰NLP

標簽

已于2024-7-16 09:24:20修改

贊

收藏

回復

舉報

回復

相關推薦

CVPR 2024滿分論文解讀：基于可變形三維高斯的高質量單目動態重建新方法

kcoufee ? 3114瀏覽 ? 0回復
Arena-Hard：開源高質量大模型評估基準

Aceryt ? 4733瀏覽 ? 0回復
ICLR 2024 Spotlight | 無懼中間步驟，MUSTARD可生成高質量數學推理數據

輕薄滴假象 ? 3693瀏覽 ? 0回復
Meta 聯合紐約大學和華盛頓大學提出MetaCLIP，帶你揭開CLIP的高質量數據之謎。

輕薄滴假象 ? 3021瀏覽 ? 0回復
七個高質量潤色論文和文章的指令

數師兄 ? 3859瀏覽 ? 0回復
CVPR 2024｜讓圖像擴散模型生成高質量360度場景，只需要一個語言模型

輕薄滴假象 ? 3568瀏覽 ? 0回復
Advanced RAG 08：使用 Self-RAG 打造高質量、可追溯的 RAG System

Baihai_IDP ? 3325瀏覽 ? 0回復
百萬高質量視頻-字幕數據助力社區提升多模態大模型視頻理解及生成能力

輕薄滴假象 ? 2900瀏覽 ? 0回復
百萬級高質量視頻數據集發布，登頂抱抱臉數據集排行榜，中科大&上海AI Lab等出品

Crystalcxt ? 3091瀏覽 ? 0回復
數據合成方法-讓模型自己說出用了哪些指令對齊數據

NLP工作站 ? 3113瀏覽 ? 0回復
超越所有NeRF方法！快速和高質量的3D編輯和身份保持新策略：DreamCatalyst

angel ? 3458瀏覽 ? 0回復
谷歌發布大模型數據篩選方法：效率提升13倍，算力降低10倍

Aceryt ? 2777瀏覽 ? 0回復
1890美元訓出11.6億參數高質量文生圖模型

duhorse ? 2466瀏覽 ? 0回復
國外驚訝，中國文生視頻模型超高質量！

Aceryt ? 3450瀏覽 ? 0回復
如何獲取高質量數據進行代碼指令調優？

NLP工作站 ? 2834瀏覽 ? 0回復
LLaMA-Omni：專為與大型語言模型（LLMs）進行低延遲、高質量的語音交互而設計

Halo咯咯 ? 3949瀏覽 ? 0回復
大模型訓練之訓練數據準備，即怎么準備高質量的訓練數據集？

AI探索時代 ? 3866瀏覽 ? 0回復
關于打造高質量RAG系統的問題記錄

AI探索時代 ? 1331瀏覽 ? 0回復
關于RAG應用中怎么高質量的進行數據召回——召回策略的研究

AI探索時代 ? 1472瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

TransDiff--最簡潔的AR Transformer + Diffusion圖像生成方法 8天前發布
遲來！解讀Qwen開源的Embedding模型中的細節！附實測結果！ 2025-06-13 07:17:37發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

我把DeepSeek微調參數扒光了，顯存和性能優化的秘密都在這 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇：數據合成方法-讓模型自己說出用了哪些指令對齊數據

下一篇： Llama3.1系列模型正式開源，最大405B，閉源模型的統治時代將迎來結束？

社區精華內容

目錄

主站蜘蛛池模板：亚洲最新在线视频 | 天天操夜夜艹 | 亚洲欧美在线观看 | 久久一二 | 在线观看涩涩视频 | 欧美一级黄色网 | 国产精品高清在线 | 国产美女视频 | 久久久影院 | 91视频进入 | 亚洲欧美日韩精品 | 欧美一级黄色片在线观看 | www.精品一区 | 亚洲精品视频久久 | 久久亚洲一区二区 | 久草新在线| 亚洲精品成人av久久 | 国产成人精品网站 | 亚洲免费人成在线视频观看 | 日韩av在线免费 | 免费视频成人国产精品网站 | 国产一区视频在线 | 羞羞的视频免费看 | 91国内精精品久久久久久婷婷 | 欧美色性 | 免费久久99精品国产婷婷六月 | 中文字幕电影在线观看 | 国产精彩视频在线观看 | 中文字幕一区二区三区精彩视频 | 色综合天天天天做夜夜夜夜做 | 一级黄色网页 | 成人av一区| 成人在线观看免费视频 | 国产精品精品视频 | 综合久久一区 | 亚洲欧美中文日韩在线v日本 | 99热这里有精品 | 一级毛片免费视频观看 | 色婷婷精品国产一区二区三区 | 亚洲精品视频免费观看 | 中文字幕国产一区 |

_{<label id="adtmx"></label>}

<label id="adtmx"><dl id="adtmx"></dl></label>

<label id="adtmx"></label>

<button id="adtmx"><form id="adtmx"><label id="adtmx"></label></form></button>