成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一

發布于 2024-4-9 10:29

瀏覽

0收藏

近日，國內的一款微調框架發布了自己的論文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，對他們的框架做了系統性的總結。該框架自推出后迅速出圈，現已斬獲15.6k的star，逐步成為當下微調的首選工具。

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一-AI.x社區

??https://arxiv.org/pdf/2403.13372.pdf??

模型微調相較于上下文學習來講，存在比較高的門檻，但又是模型專業化，領域化不可或缺的技術手段。而其復雜性突出表現在這些方面：

1）理論基礎，如果說基于大模型寫prompt 根據一定范式來構建RAG或者Agent不需要太多機器學習理論知識，然而微調就必須要對這些有理解，比如樣本，學習率，logloss等。

2）數據準備，對于普通開發者，高質量的數據是微調成功的關鍵保證，而如何預處理，清洗，標注這些樣本本身就很復雜，更因此誕生了大模型數據工程這樣的領域來解決這一問題。

3）基座模型存在分化，雖然當下很多模型都參考llama和huggingface的一些規范，但是仍然都有一些特殊之處，想要微調也需要針對性地去分析和構建相應的策略。

4）超參數優化，微調本身是一個“煉丹”過程，如何能夠找到合適的超參數，達到一個最佳性能，是一個重大挑戰。

5）AI工程復雜性，涉及到硬件\軟件\復雜流程的協同配合以及系統優化，在有限的成本、資源和時間要求下完成模型訓練過程。

正是因為這些原因，對于預訓練微調，需要一個類似于工廠的工業化手段來降低門檻，提升效率。

因此，行業內出現了很多微調框架，而LLamaFactory（https://github.com/hiyouga/LLaMA-Factory）便是其中之一，從起名上就可以看出它們的目標是成為模型微調的工廠。

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一-AI.x社區

它得以流行主要得益于支持當下主流的大模型百川、千問、LLaMA等，不僅集成了大模型預訓練、監督微調和強化微調等階段的主流的微調技術（支持 LoRA 和 QLoRA 等參數高效微調策略），還提供了預訓練、指令微調等豐富的數據集，方便參考使用，最重要的是提供了一個無代碼的圖形界面，大幅降低使用門檻，非開發者也可以方便地完成模型微調。

該框架架構上由四個模塊構成：模型加載器、數據工作器和訓練器，以及用戶界面LlamaBoard。

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一-AI.x社區

在根據官方文檔安裝好LLamaFactory后，可以有三種方式進行操作，WebUI、CLI或者Python。

1.webUI。

CUDA_VISIBLE_DEVICES=0 python src/train_web.py

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一-AI.x社區

2.CLI,由于有時候界面限制，可能需要命令行的方式進行微調。如果不知道具體格式，可以在界面上配置好，再復制到命令行中調整使用。

當下最容易上手的大模型微調工具是誰？LLamaFactory或是其中之一-AI.x社區

在example目錄中有大量的示例可供參考。

examples/
├── lora_single_gpu/
│   ├── pretrain.sh: 進行預訓練
│   ├── sft.sh: 進行指令監督微調
│   ├── reward.sh: 進行獎勵模型訓練
│   ├── ppo.sh: 進行 PPO 訓練
│   ├── dpo.sh: 進行 DPO 訓練
│   ├── orpo.sh: 進行 ORPO 訓練
│   ├── prepare.sh: 保存預處理后的數據集
│   └── predict.sh: 進行批量預測
├── qlora_single_gpu/
│   ├── bitsandbytes.sh: 微調 4/8 比特 BNB 模型
│   ├── gptq.sh: 微調 4/8 比特 GPTQ 模型
│   ├── awq.sh: 微調 4 比特 AWQ 模型
│   └── aqlm.sh: 微調 2 比特 AQLM 模型
├── lora_multi_gpu/
│   ├── single_node.sh: 使用 Accelerate 進行單節點訓練
│   └── multi_node.sh: 使用 Accelerate 進行多節點訓練
├── full_multi_gpu/
│   ├── single_node.sh: 使用 DeepSpeed 進行單節點訓練
│   └── multi_node.sh: 使用 DeepSpeed 進行多節點訓練
├── merge_lora/
│   ├── merge.sh: 將 LoRA 權重合并到預訓練模型中
│   └── quantize.sh: 使用 AutoGPTQ 量化模型
├── inference/
│   ├── cli_demo.sh: 啟動命令行推理接口
│   ├── api_demo.sh: 啟動 OpenAI 風格 API
│   ├── web_demo.sh: 啟動瀏覽器推理接口
│   └── evaluate.sh: 在 MMLU 數據集上評測模型
└── extras/
    ├── galore/
    │   └── sft.sh: 使用 GaLore 訓練模型
    ├── loraplus/
    │   └── sft.sh: 使用 LoRA+ 訓練模型
    ├── llama_pro/
    │   ├── expand.sh: 擴展模型中的層
    │   └── sft.sh: 訓練擴展后的模型
    └── fsdp_qlora/
        └── sft.sh: 使用 FSDP 微調量化模型

3）編程方式。

from llmtuner import run_exp
run_exp(dict(
  stage="sft",
  do_train=True,
  model_name_or_path="Qwen/Qwen1.5-0.5B-Chat",
  dataset="identity,alpaca_gpt4_en,alpaca_gpt4_zh",
  template="qwen",
  finetuning_type="lora",
  lora_target="all",
  output_dir="test_identity",
  per_device_train_batch_size=4,
  gradient_accumulation_steps=4,
  lr_scheduler_type="cosine",
  logging_steps=10,
  save_steps=100,
  learning_rate=1e-4,
  num_train_epochs=5.0,
  max_samples=500,
  max_grad_norm=1.0,
  fp16=True,
))

對于用戶來講，準備正確高質量的數據是用好該工具的關鍵。在使用自定義數據集時需要在 dataset_info.json 文件中按照以下格式提供數據集定義，數據集格式支持兩種：alpaca 和 sharegpt，具體可參考其官方文檔。

"數據集名稱": {
  "hf_hub_url": "Hugging Face 的數據集倉庫地址（若指定，則忽略 script_url 和 file_name）",
  "ms_hub_url": "ModelScope 的數據集倉庫地址（若指定，則忽略 script_url 和 file_name）",
  "script_url": "包含數據加載腳本的本地文件夾名稱（若指定，則忽略 file_name）",
  "file_name": "該目錄下數據集文件的名稱（若上述參數未指定，則此項必需）",
  "file_sha1": "數據集文件的 SHA-1 哈希值（可選，留空不影響訓練）",
  "subset": "數據集子集的名稱（可選，默認：None）",
  "folder": "Hugging Face 倉庫的文件夾名稱（可選，默認：None）",
  "ranking": "是否為偏好數據集（可選，默認：False）",
  "formatting": "數據集格式（可選，默認：alpaca，可以為 alpaca 或 sharegpt）",
  "columns（可選）": {
    "prompt": "數據集代表提示詞的表頭名稱（默認：instruction）",
    "query": "數據集代表請求的表頭名稱（默認：input）",
    "response": "數據集代表回答的表頭名稱（默認：output）",
    "history": "數據集代表歷史對話的表頭名稱（默認：None）",
    "messages": "數據集代表消息列表的表頭名稱（默認：conversations）",
    "system": "數據集代表系統提示的表頭名稱（默認：None）",
    "tools": "數據集代表工具描述的表頭名稱（默認：None）"
  },
  "tags（可選，用于 sharegpt 格式）": {
    "role_tag": "消息中代表發送者身份的鍵名（默認：from）",
    "content_tag": "消息中代表文本內容的鍵名（默認：value）",
    "user_tag": "消息中代表用戶的 role_tag（默認：human）",
    "assistant_tag": "消息中代表助手的 role_tag（默認：gpt）",
    "observation_tag": "消息中代表工具返回結果的 role_tag（默認：observation）",
    "function_tag": "消息中代表工具調用的 role_tag（默認：function_call）",
    "system_tag": "消息中代表系統提示的 role_tag（默認：system，會覆蓋 system 列）"
  }
}

經過以上的步驟，剩下的就是需要耐心的調參和評估了。下面是一個利用webui進行微調操作示例。

小結

相較于其他方法，目前，LlamaFactory可以說是當下最簡單快捷又功能強大的一種微調工具，值得大家學習使用。

標簽

贊

收藏

回復

舉報

回復

相關推薦

今日arXiv最熱NLP大模型論文：Github萬星！北航發布零代碼大模型微調平臺LlamaFactory

pangguiyu ? 4799瀏覽 ? 0回復
讓大模型不再「巨無霸」，這是一份最新的大模型參數高效微調綜述

輕薄滴假象 ? 2791瀏覽 ? 0回復
6成企業擬采用AI，投入生產的僅占其中三分之一；OpenAI穩坐王位；

51CTO技術棧 ? 2561瀏覽 ? 0回復
GPT-4o熱潮來襲：探索圖生文本的奧秘（多模態大模型系列之一）

魚蟲子 ? 7972瀏覽 ? 0回復
LLMCompiler：大模型的并行工具調用

AIGC最前線 ? 4899瀏覽 ? 0回復
大模型的“手和腳”——連接外部應用的通道函數調用(function calling)，AI Agent的實現方式之一

AI探索時代 ? 7255瀏覽 ? 0回復
你知道什么是微調嗎？大模型為什么要微調？以及大模型微調的原理是什么？

AI探索時代 ? 6962瀏覽 ? 0回復
大模型的核心之一——大模型預訓練之數據預處理

AI探索時代 ? 5241瀏覽 ? 0回復
Ollama，本地運行大模型最強工具，輕松上手

小虎哦哦 ? 1.0w瀏覽 ? 0回復
五個超級容易上手的AI項目

小虎哦哦 ? 2780瀏覽 ? 0回復
使用 LlamaFactory 結合開源大語言模型實現文本分類：從數據集構建到 LoRA 微調與推理評估

AI悠閑區 ? 7151瀏覽 ? 0回復
在AutoDL上使用LLamaFactory進行模型訓練

一起AI技術 ? 5641瀏覽 ? 0回復
基于 LlamaFactory 微調大模型的實體識別的評估實現

AI悠閑區 ? 2684瀏覽 ? 0回復
DeepSeek創始人是誰？這個問題DeepSeek也整不會了！

51CTO技術棧 ? 2487瀏覽 ? 0回復
用 vLLM 快速上手 DeepSeek 大模型部署

穿越時空111 ? 9579瀏覽 ? 0回復
大模型是一場新的搜索戰爭，OpenAI不會贏家通吃，一家最好被收購！

51CTO技術棧 ? 2358瀏覽 ? 0回復
神經網絡的兩個重難點之一，數據處理和模型設計

AI探索時代 ? 1642瀏覽 ? 0回復
從 Manus 到 DeepSearcher，2025年最值得關注的十大 Agent 智能體架構設計

玄姐聊AGI ? 4976瀏覽 ? 0回復
2025年最值得關注的十大多模態大語言模型！

Halo咯咯 ? 7072瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

思維外包化！AI正在“廢掉”我們的大腦 2025-06-25 07:40:36發布
上下文工程的崛起：提示工程已是過去式 2025-06-25 07:38:23發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

我把DeepSeek微調參數扒光了，顯存和性能優化的秘密都在這 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇：檢索感知微調（RAFT），提升領域RAG效果的新方法

下一篇：為什么大佬都在說Agent是未來？換個角度來談一談

社區精華內容

目錄

主站蜘蛛池模板：天天干天天色 | 黄色一级大片在线免费看产 | 国产精品99久久免费观看 | 999精品视频 | 欧美性成人 | 啪视频在线 | av中文字幕在线观看 | 国产成人精品一区 | 久久午夜电影 | 亚洲国产精品一区二区久久 | 欧美天堂一区 | 国产激情一区二区三区 | 青青草在线视频免费观看 | 免费一级片 | 亚洲高清视频在线观看 | 亚洲欧美在线视频 | 天天操夜夜操 | 国产精品99久久久久久宅男 | 日韩国产中文字幕 | 992人人草| 日韩视频在线一区 | 99久久免费精品国产男女高不卡 | www.亚洲.com| 日韩精品中文字幕一区二区三区 | 久久首页 | 欧美一级在线免费观看 | 九七午夜剧场福利写真 | 日本成人三级电影 | 一区二区三区中文字幕 | 欧美不卡网站 | 99久久婷婷国产综合精品首页 | 精品一区二区观看 | 国产精品99一区二区 | 欧美成ee人免费视频 | 男人天堂久久久 | 欧美视频| 日韩国产中文字幕 | 91国产精品在线 | 天堂中文在线播放 | 综合五月婷 | 在线日韩不卡 |