成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<table id="a8qiw"><source id="a8qiw"></source></table>

<strike id="a8qiw"><dd id="a8qiw"></dd></strike>

<pre id="a8qiw"></pre>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題原創(chuàng)

發(fā)布于 2025-6-11 09:41

瀏覽

0收藏

身為一名AI工程師，我過(guò)去的工作主要集中在應(yīng)用層開(kāi)發(fā)，對(duì)算法的理解并不深入。然而，近期我開(kāi)始對(duì)算法產(chǎn)生了濃厚的興趣，并轉(zhuǎn)向研究模型微調(diào)。在眾多微調(diào)算法中，Lora以其普遍應(yīng)用引起了我的關(guān)注，我計(jì)劃在本文中對(duì)它進(jìn)行詳細(xì)介紹。將Lora僅僅視為一種算法可能并不準(zhǔn)確，它更像是一種精妙的技巧或策略。下文將圍繞幾個(gè)核心問(wèn)題，全面探討和解析Lora技術(shù)，希望這些內(nèi)容能為對(duì)模型微調(diào)感興趣的你提供有用的參考和幫助。

Lora是什么

假設(shè)大模型的原始的權(quán)重矩陣w是:

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

全量微調(diào)需要更新 5 * 4 = 20個(gè)參數(shù)，假設(shè)微調(diào)后的參數(shù)是:

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

這個(gè)可以轉(zhuǎn)化為：

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

其中ΔW 可以分解為

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

矩陣 ( A )：尺寸 ( 5 * 2 )，共10個(gè)參數(shù)
矩陣 ( B )：尺寸 ( 2 * 4 )，共8個(gè)參數(shù)
LoRA總參數(shù)：( 10 + 8 = 18 ) 個(gè)

也就是說(shuō)通過(guò)LoRA微調(diào)，調(diào)參對(duì)象從 W 變?yōu)?A、B，使得參數(shù)量從20個(gè)減少為18個(gè)，這是簡(jiǎn)化的例子。在實(shí)際案例中，參數(shù)量可以減少為0.01%~3%左右。

為什么需要LoRA

LoRA最早出現(xiàn)在2021年由微軟研究院提出的一篇論文中（《LoRA: Low-Rank Adaptation of Large Language Models》），LoRA的核心思路是：與其每次都復(fù)制整個(gè)模型，不如只調(diào)整一小部分參數(shù)，把成本降下來(lái)。它的目標(biāo)是解決大模型微調(diào)中的兩大痛點(diǎn)：

資源消耗太大：大型語(yǔ)言模型動(dòng)輒幾億甚至幾千億參數(shù)，全參數(shù)微調(diào)需要為每個(gè)新任務(wù)保存一份完整的模型副本。比如，一個(gè)10億參數(shù)的模型，假設(shè)每個(gè)參數(shù)用4字節(jié)（float32），光存儲(chǔ)就得4GB。多個(gè)任務(wù)下來(lái)，硬盤(pán)和顯存都吃不消。
訓(xùn)練效率低下：全參數(shù)微調(diào)不僅占空間，還需要大量計(jì)算資源和時(shí)間。每次訓(xùn)練都得更新所有參數(shù)。

LoRA的核心亮點(diǎn)

參數(shù)少

在GPT-3上，??r = 8??的LoRA參數(shù)量占全微調(diào)的0.01%-0.1%，性能卻達(dá)到全微調(diào)的95%-99%。
在GLUE任務(wù)（BERT），??r = 16??的LoRA用0.1%參數(shù)，平均得分僅比全微調(diào)低0.5-1分。
它只微調(diào)原始參數(shù)的1%甚至更少。

速度快

訓(xùn)練和部署都比全參數(shù)微調(diào)省時(shí)省力。

模塊化

訓(xùn)練好的LoRA“插件”可以隨時(shí)加載或卸載，不影響原始模型，特別適合多任務(wù)場(chǎng)景。

模塊化設(shè)計(jì)的優(yōu)點(diǎn)

避免災(zāi)難性遺忘
直接修改???W??? 可能導(dǎo)致模型在新任務(wù)上表現(xiàn)良好，但在原始任務(wù)上性能下降（即“災(zāi)難性遺忘”）。LoRA通過(guò)凍結(jié)核心??W??，保留了原始模型的能力。
存儲(chǔ)高效
一個(gè)大模型可以搭配多個(gè)LoRA模塊，每個(gè)模塊只占用MB級(jí)空間，相比全模型微調(diào)動(dòng)輒幾GB，節(jié)省顯著。
快速切換任務(wù)
任務(wù)切換只需加載不同LoRA文件，幾秒鐘搞定，不用重新訓(xùn)練。
兼容性強(qiáng)
原始模型完全不動(dòng)，多個(gè)團(tuán)隊(duì)可以共享同一個(gè)基礎(chǔ)模型，只開(kāi)發(fā)自己的LoRA模塊。

為什么可以對(duì)增量權(quán)重 ΔW 低秩分解？

低秩分解的核心思想是：矩陣?yán)锏男畔⑼皇蔷鶆蚍植嫉?，很多維度是冗余的，只需要抓住"主要方向"就夠了。

1. 什么是矩陣的秩（Rank）？

在線性代數(shù)中，一個(gè)矩陣的秩（rank）是它的線性獨(dú)立行或列的數(shù)量。如果一個(gè)矩陣是"低秩"的，意味著它的信息可以用少量獨(dú)立方向表達(dá)，而不是需要完整的維度。

比如下述矩陣，第5行 ??[1, 2, 0, 3, 0]??? 是第1行 ??[1, 0, 0, 2, 0]??? 和第2行 ??[0, 2, 0, 1, 0]?? 的線性組合（第5行=第1行+第2行），第5行沒(méi)有提供更多的信息，理論上這個(gè)矩陣有前4行就能提供所有信息了，因此矩陣的行秩為4（列秩也為4，第5列全為0，沒(méi)有信息增量）。

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

2. 低秩分解的原理

奇異值分解（SVD）可以把任意矩陣分解成三個(gè)矩陣的乘積。對(duì)于一個(gè)形狀 ( d * k ) 的矩陣 ( W )，SVD可以寫(xiě)成：

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

( U ) 是 ( d * d ) 的正交矩陣
(Σ ) 是 ( d * k ) 的對(duì)角矩陣（奇異值按降序排列）
( V^T ) 是 ( k * k ) 的正交矩陣（( V ) 的轉(zhuǎn)置）

其中 ( r ) 是矩陣的秩（非零奇異值的數(shù)量）。通過(guò)保留前 ( r ) 個(gè)最大的奇異值（低秩近似），可以用更少的參數(shù)近似原矩陣 ( W )。

任意矩陣（無(wú)論是實(shí)數(shù)還是復(fù)數(shù)、方陣還是非方陣、滿秩還是不滿秩）都可以通過(guò)奇異值分解（SVD）精確拆分為三個(gè)特定矩陣的乘積

舉個(gè)例子，針對(duì)上述矩陣 ( S ) 的SVD分解（計(jì)算過(guò)程略）：

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

如果只保留前三個(gè)奇異值（7.03, 3, 2.15），重構(gòu)后的矩陣 ( S' ) 與原矩陣 ( S ) 幾乎一致(三個(gè)矩陣分別取前三列，前三行&前三列，前三行)：

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題-AI.x社區(qū)

結(jié)果對(duì)比原始矩陣和重構(gòu)矩陣，直觀上來(lái)看，基本保持一致，這就是說(shuō)：如果只保留最大的幾個(gè)奇異值，就能用更少的參數(shù)近似表示w。

3. 為什么可以對(duì)增量權(quán)重 ΔW 低秩分解？

研究發(fā)現(xiàn)：

信息集中性：微調(diào)后的權(quán)重變化 ( ΔW) 的奇異值分布中，前10-20個(gè)奇異值占據(jù)了90%以上的信息（LoRA論文在GPT-3上的實(shí)驗(yàn)結(jié)論）。
結(jié)構(gòu)化特性：(ΔW ) 的變化不是隨機(jī)的，而是集中在少數(shù)"任務(wù)相關(guān)方向"上（例如讓模型學(xué)習(xí)法律術(shù)語(yǔ)只需調(diào)整少量語(yǔ)義方向）。
高效近似：直接用低秩矩陣 ( A * B ) 構(gòu)造 (ΔW )，無(wú)需完整SVD計(jì)算，參數(shù)量從 ( d * k ) 降至 ( (d + k) * r )。

直觀理解：微調(diào)類似于讓一個(gè)已學(xué)會(huì)"說(shuō)話"的模型掌握某種"口音"。這種調(diào)整只需修改少數(shù)關(guān)鍵維度（如詞匯選擇），而非全部語(yǔ)言規(guī)則，因此低秩足夠。

舉個(gè)例子：
對(duì)一個(gè) ( 512 * 512 ) 的權(quán)重矩陣（262,144參數(shù)）：

全微調(diào)：更新全部262,144個(gè)參數(shù)。
LoRA（( r=8 )）：僅需 ( 512 * 8 + 8 * 512 = 8,192 ) 個(gè)參數(shù)，即可捕捉主要變化。

4. 對(duì)原始權(quán)重 ( W ) 可以低秩分解嗎？

不行。預(yù)訓(xùn)練模型的權(quán)重 ( W ) 通常接近滿秩（奇異值分布平滑），低秩分解會(huì)丟失關(guān)鍵信息。而 ( ΔW ) 的秩天然較低，適合分解。

LoRA是如何更新參數(shù)的

本質(zhì)上，LoRA仍然使用反向傳播算法進(jìn)行參數(shù)更新，但僅針對(duì)新增的低秩矩陣 ( A ) 和 ( B )，而保持原始權(quán)重 ( W ) 凍結(jié)。

參數(shù)更新過(guò)程

（1）初始化

( W ) 使用預(yù)訓(xùn)練模型的權(quán)重，梯度計(jì)算被禁用（不更新）。
( A ) 用小的隨機(jī)高斯分布初始化
( B ) 初始化為全零矩陣，確保訓(xùn)練開(kāi)始時(shí) ( ΔW = 0 )，避免干擾原始模型。

（2）前向傳播

輸入數(shù)據(jù) ( X ) 通過(guò)調(diào)整后的權(quán)重計(jì)算輸出
根據(jù)任務(wù)目標(biāo) 計(jì)算損失函數(shù) ( L )（如交叉熵?fù)p失）。

（3）反向傳播

計(jì)算損失 ( L ) 對(duì) ( A ) 和 ( B ) 的梯度
不計(jì)算( W ) 的梯度（因其被凍結(jié)）。

（4）參數(shù)更新

使用優(yōu)化器（如Adam）更新

（5）迭代優(yōu)化

重復(fù)步驟2-4，直到損失收斂或達(dá)到訓(xùn)練輪次。
訓(xùn)練完成后，( A ) 和 ( B ) 捕捉了任務(wù)特定的調(diào)整信息。

推理部署選項(xiàng)

合并權(quán)重：將 ( W' = W + A * B ) 合并為單一矩陣，直接用于推理（適合固定任務(wù)）。
動(dòng)態(tài)加載：保持 ( W ) 和 ( A * B ) 分離，靈活切換不同任務(wù)的LoRA模塊（適合多任務(wù)場(chǎng)景）。

關(guān)鍵特點(diǎn)

參數(shù)高效：僅訓(xùn)練 ( A ) 和 ( B )，參數(shù)量從 ( d * k ) 降至 ( (d + k) * r )。
內(nèi)存節(jié)省：無(wú)需存儲(chǔ)全參數(shù)微調(diào)的梯度，顯存占用大幅降低。
兼容性：原始模型 ( W ) 保持不變，支持多任務(wù)共享。

LoRA可以用在Transformer的哪些層

LoRA是"好鋼要用在刀刃上"。并非模型的所有參數(shù)都需要微調(diào)，選擇關(guān)鍵層進(jìn)行適配即可達(dá)到接近全參數(shù)微調(diào)的效果。LoRA目前主要可以應(yīng)用在transformer中的以下兩類層：

Transformer是谷歌在2017年推出的深度學(xué)習(xí)模型，專門(mén)處理序列數(shù)據(jù)。簡(jiǎn)單來(lái)說(shuō)，序列數(shù)據(jù)就像排隊(duì)的小朋友，每個(gè)小朋友都有自己的位置和信息，Transformer能把這些信息處理得明明白白。后面有空我會(huì)專門(mén)出一個(gè)系列講解一下。

1. 注意力層（Self-Attention）

Transformer的核心是多頭注意力機(jī)制，每個(gè)注意力頭包含4個(gè)權(quán)重矩陣：

( W_q )（Query）
( W_k )（Key）
( W_v )（Value）
( W_o )（Output）

LoRA通常應(yīng)用在：

( W_q ) 和 ( W_v )（最高優(yōu)先級(jí)）：
調(diào)整 ( W_q ) 可改變模型"關(guān)注哪些信息"。
調(diào)整 ( W_v ) 可影響"如何編碼關(guān)注的信息"。
( W_o )（次優(yōu)先級(jí)）：
調(diào)整輸出投影矩陣，但收益通常不如 ( W_q ) 和 ( W_v ) 顯著。

實(shí)驗(yàn)結(jié)論（來(lái)自LoRA原論文）：

僅微調(diào) ( W_q ) 和 ( W_v ) 即可達(dá)到全參數(shù)微調(diào)效果的90%以上。
添加 ( W_o ) 的LoRA對(duì)性能提升有限（<2%），但會(huì)增加參數(shù)量。

2. 前饋網(wǎng)絡(luò)層（FFN）

FFN包含兩個(gè)線性變換：

( W_1 )：升維（通常放大4倍，如d_model → 4×d_model）
( W_2 )：降維（4×d_model → d_model）

適用場(chǎng)景：

大模型（如GPT-3）：添加FFN層的LoRA可進(jìn)一步提升性能。
復(fù)雜生成任務(wù)：調(diào)整FFN能增強(qiáng)任務(wù)特定的特征表達(dá)。

不推薦使用LoRA的層

（1）嵌入層（Embedding）：

參數(shù)量大但微調(diào)收益低，凍結(jié)可節(jié)省資源。

（2）LayerNorm/Bias：

參數(shù)少，直接全參數(shù)微調(diào)成本低。
LayerNorm的縮放因子和偏置本身具有低秩特性，無(wú)需LoRA。

實(shí)際配置建議

模型規(guī)模	推薦LoRA目標(biāo)層	典型rank (r)
小模型（如BERT）	僅 ( W_q ), ( W_v )	8-16
大模型（如GPT-3）	( W_q ), ( W_v ), FFN的 ( W_1 )	32-64
復(fù)雜生成任務(wù)	所有注意力矩陣 + FFN	64+

模塊化設(shè)計(jì)優(yōu)勢(shì)

任務(wù)切換：不同任務(wù)可獨(dú)立配置LoRA模塊（如翻譯任務(wù)用( W_q ), ( W_v )，摘要任務(wù)額外啟用FFN）。
資源分配：對(duì)關(guān)鍵層分配更高秩（如( r=32 )），次要層用低秩（如( r=8 )）。

LoRA訓(xùn)練時(shí)需要調(diào)整哪些超參數(shù)

以 LLaMA-Factory 的配置為例，說(shuō)明 LoRA 的關(guān)鍵超參數(shù)及其調(diào)參策略：

核心參數(shù)表

參數(shù)名	類型/范圍	含義	建議值	默認(rèn)值
?`?finetuning_type?`?	?`?["full","freeze","lora"]?`?	微調(diào)類型選擇	必須設(shè)為 ?`?"lora"?`?	?`?"lora"?`?
?`?lora_rank?`? (r)	正整數(shù)	LoRA的秩，決定矩陣A/B的列數(shù)/行數(shù)	簡(jiǎn)單任務(wù)：8-16 中等任務(wù)：32 復(fù)雜任務(wù)：64+	8
?`?lora_alpha?`? (α)	正整數(shù)	縮放系數(shù)，控制ΔW對(duì)原始權(quán)重W的影響強(qiáng)度	通常設(shè)為 ?`?lora_rank?`? 的1-2倍（如r=16時(shí)α=32）	None
?`?lora_dropout?`?	0.0-1.0	LoRA層的Dropout概率	大數(shù)據(jù)集：0.0 小數(shù)據(jù)集：0.05-0.1（防過(guò)擬合）	0.0
?`?lora_target?`?	逗號(hào)分隔的字符串	應(yīng)用LoRA的模塊名稱（需匹配模型層名）	默認(rèn)：?`?"q_proj,v_proj"?`??復(fù)雜任務(wù)：?`?"q_proj,k_proj,v_proj,o_proj"?`?	?`?"all"?`?
?`?additional_target?`?	逗號(hào)分隔的字符串	額外擴(kuò)展的LoRA目標(biāo)模塊（如FFN層）	通常留空，大模型可加?`?"ffn.w1,ffn.w2"?`?	None

調(diào)參技巧

秩（r）的選擇

小數(shù)據(jù)集（<5K樣本）：r=8
大數(shù)據(jù)集（>50K樣本）：r=32+
從小開(kāi)始：優(yōu)先嘗試r=8或16，逐步增加直至性能飽和。
數(shù)據(jù)量關(guān)聯(lián)：

目標(biāo)層選擇策略

# 簡(jiǎn)單任務(wù)（如分類）
lora_target = "q_proj,v_proj"

# 復(fù)雜任務(wù)（如生成）
lora_target = "q_proj,k_proj,v_proj,o_proj,ffn.w1,ffn.w2"

3.改進(jìn)技術(shù)的適用場(chǎng)景

LoRA+：訓(xùn)練速度要求高時(shí)啟用（設(shè)??lorapius_lr_ratio=8??）。
DoRA：需要逼近全微調(diào)性能時(shí)開(kāi)啟（??use_dora=true??）。
rsLoRA：當(dāng)r≥32時(shí)更穩(wěn)定（??use_rslora=true??）。

參數(shù)影響對(duì)比

超參數(shù)	參數(shù)量影響	訓(xùn)練速度	性能影響
?`?lora_rank?`? ↑	線性增加	略微下降	先升后平
?`?lora_alpha?`? ↑	無(wú)影響	無(wú)影響	調(diào)節(jié)強(qiáng)度
?`?use_dora=true?`?	增加約10%	下降10%-20%	提升1%-3%
?`?pissa_init=true?`?	無(wú)影響	初始化耗時(shí)增加	收斂更快

經(jīng)典配置示例

# GLUE任務(wù)（BERT-base）
lora_rank:16
lora_alpha:32
lora_target:"query,value"
lora_dropout:0.1

# GPT-3文本生成
lora_rank:64
lora_alpha:128
use_rslora:true
lora_target:"q_proj,v_proj,ffn.w1"

總結(jié)

LoRA是一種高效的大模型微調(diào)技術(shù)，它通過(guò)低秩矩陣分解顯著地減少了參數(shù)量和計(jì)算資源的需求，同時(shí)又能保持接近全模型微調(diào)的性能。在接下來(lái)的文章中，我們將從實(shí)戰(zhàn)角度出發(fā)，借由Llama-Factory來(lái)進(jìn)行模型微調(diào)。我希望能幫助讀者從零開(kāi)始，全面掌握模型微調(diào)的知識(shí)和技巧。

本文轉(zhuǎn)載自??AI 博物院?? 作者：longyunfeigu

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-6-11 10:12:49修改

贊 1

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

熱門(mén)內(nèi)容榜 ? 最近上榜

回復(fù)

相關(guān)推薦

大模型微調(diào)新范式：當(dāng)LoRA遇見(jiàn)MoE

zhangyannni ? 3934瀏覽 ? 0回復(fù)
中科大等意外發(fā)現(xiàn)：大模型不看圖也能正確回答視覺(jué)問(wèn)題！

Crystalcxt ? 2485瀏覽 ? 0回復(fù)
無(wú)限重生圖片樣式，999次也沒(méi)問(wèn)題！

Aceryt ? 2828瀏覽 ? 0回復(fù)
LLM高效微調(diào)詳解-從Adpter、PrefixTuning到LoRA

angel ? 4241瀏覽 ? 0回復(fù)
LLM微調(diào)技術(shù)LoRA圖解

51CTO內(nèi)容精選 ? 3410瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時(shí)代 ? 6914瀏覽 ? 0回復(fù)
從原理到挑戰(zhàn)，梳理AI智能體應(yīng)用

小虎哦哦 ? 3612瀏覽 ? 0回復(fù)
Llama 3.2：AI視覺(jué)革新，手機(jī)也能跑大模型

sbf_2000 ? 2957瀏覽 ? 0回復(fù)
小白也能讀懂的GraphRAG知識(shí)圖譜全流程解析，多圖預(yù)警！

AI博物院 ? 8213瀏覽 ? 0回復(fù)
優(yōu)雅談大模型：一文讀懂LoRA/DoRA/MoRA

魯班模錘1 ? 4068瀏覽 ? 0回復(fù)
當(dāng)大模型也配備“秘書(shū)”：AssistRAG 的創(chuàng)新與應(yīng)用

芝士AI吃魚(yú) ? 2493瀏覽 ? 0回復(fù)
Sonauto免費(fèi)AI音樂(lè)編輯器：小白也能快速上手的音樂(lè)創(chuàng)作平臺(tái)！

穿越時(shí)空111 ? 6875瀏覽 ? 0回復(fù)
深入解析Transformers、BERT與SBERT：從原理到應(yīng)用

Halo咯咯 ? 4686瀏覽 ? 0回復(fù)
這個(gè)問(wèn)題DeepSeek也整不會(huì)了！

51CTO技術(shù)棧 ? 2426瀏覽 ? 0回復(fù)
DeepSeek開(kāi)源FlashMLA，小白也能看懂的GPU黑科技

Bx玩AI ? 2352瀏覽 ? 0回復(fù)
解鎖多模態(tài)大語(yǔ)言模型：從原理到實(shí)戰(zhàn)，一文全掌握！

Halo咯咯 ? 3372瀏覽 ? 0回復(fù)
大模型調(diào)參技巧—如何實(shí)現(xiàn)超參的跨模型尺度遷移

shizhi02 ? 1857瀏覽 ? 0回復(fù)
AI Agents-5 | AI工作流與代理的深度剖析：從原理到實(shí)戰(zhàn)應(yīng)用

Halo咯咯 ? 1936瀏覽 ? 0回復(fù)
線性代數(shù)在模型優(yōu)化領(lǐng)域中的應(yīng)用

每天五分鐘玩轉(zhuǎn)人工智能 ? 1097瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

100行代碼搞定多智能體？這個(gè)極簡(jiǎn)AI框架PocketFlow有點(diǎn)東西 1天前發(fā)布
為什么 Cursor 生成的代碼總不符合你的習(xí)慣？試試這幾種方法 7天前發(fā)布

熱門(mén)推薦

谷歌Gemini 2.5家族全面升級(jí)：Pro、Flash與Flash-Lite正式發(fā)布，AI推理能力再進(jìn)化 0回復(fù)

三大框架 Dify/RAGFlow/n8n怎么選？企業(yè)低成本落地AI的最優(yōu)解 0回復(fù)

超越FastGPT、Dify！Agentic CoT 架構(gòu)實(shí)現(xiàn)RAG回答準(zhǔn)確率突破94%大關(guān) 0回復(fù)

MCP Server怎么做權(quán)限控制？5分鐘教會(huì)你快速給MCP 服務(wù)成功添加授權(quán) 0回復(fù)

Dify 知識(shí)庫(kù)外接 RAGFlow 喂飯教程！附避坑指南 0回復(fù)

上一篇： MCP Server怎么做權(quán)限控制？5分鐘教會(huì)你快速給MCP 服務(wù)成功添加授權(quán)

下一篇：三大框架 Dify/RAGFlow/n8n怎么選？企業(yè)低成本落地AI的最優(yōu)解

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：免费一级黄色录像 | 日韩精品无码一区二区三区 | 亚洲精品久 | 中文字幕一区二区三区在线观看 | 中文在线视频 | 国产精品久久一区 | 精品福利视频一区二区三区 | av网站在线看| 国产日韩精品一区二区 | 91在线视频播放 | 欧美成人一级视频 | 一片毛片 | 伊人网在线综合 | 在线第一页| 51ⅴ精品国产91久久久久久 | 午夜影院毛片 | 99久久婷婷国产综合精品电影 | 国产免费又色又爽又黄在线观看 | 天天综合久久 | 午夜免费视频 | 成人国产免费视频 | av资源中文在线天堂 | 免费网站国产 | 91久久精品国产 | 精品久久久久久亚洲精品 | 成人免费观看视频 | 91精品国产一区二区在线观看 | 国产成人aⅴ | 黄色片在线 | 亚洲欧美日韩在线 | 一区二区国产在线 | 日日日日操| 欧美视频一区二区三区 | 日韩精品一区二区三区中文字幕 | 中文字幕在线观看一区二区 | 久久久久久综合 | 国产免费一区二区三区 | 日韩电影免费观看中文字幕 | 日韩精品在线观看网站 | 国产黄色大片在线免费观看 | 99re在线视频观看 |

<abbr id="8gkc6"></abbr>

<input id="8gkc6"><th id="8gkc6"></th></input>

<bdo id="8gkc6"></bdo>

<dl id="8gkc6"><dd id="8gkc6"></dd></dl>