成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型 原創(chuàng)

發(fā)布于 2025-7-15 08:53
瀏覽
0收藏

微軟剛剛發(fā)布了 Phi-4-mini-flash-reasoning 模型:

?基于全新的混合架構(gòu)構(gòu)建

?吞吐量提升 10 倍,延遲降低 2-3 倍

?在不犧牲推理性能的前提下顯著加速推理

微軟將大部分繁重的計(jì)算工作轉(zhuǎn)移到精簡的 SambaY 架構(gòu)上,配合小型門控模塊,讓同樣的 38 億參數(shù)模型思考更快、響應(yīng)更迅速。

Phi-4-mini-flash-reasoning 保持了 38 億參數(shù)的緊湊規(guī)模,但重新設(shè)計(jì)了信息流動方式。全新的解碼器-混合-解碼器架構(gòu) SambaY 讓輕量級循環(huán)組件處理上下文,單個全注意力層負(fù)責(zé)全局連接,而小巧的門控記憶單元(GMU)將這些工作在整個架構(gòu)中循環(huán)利用。

相比 Phi-4-mini-reasoning,該模型在長上下文生成和對延遲敏感的推理任務(wù)中表現(xiàn)出顯著更低的延遲和更高的吞吐量。

Phi-4-mini-flash-reasoning 的核心是全新的解碼器-混合-解碼器架構(gòu) SambaY,其關(guān)鍵創(chuàng)新是門控記憶單元(GMU)——一種簡單而有效的層間表示共享機(jī)制。SambaY 架構(gòu)的主要優(yōu)勢包括:

?增強(qiáng)解碼效率

?保持線性預(yù)填充時間復(fù)雜度

?提升可擴(kuò)展性和長上下文性能

?吞吐量提升高達(dá) 10 倍

解碼器前半部分運(yùn)行 Mamba + 滑動窗口注意力,保持線性成本。一個全注意力層計(jì)算并存儲鍵值,然后后半部分通過交叉注意力獲取這些鍵值。每隔一個交叉注意力層被替換為 GMU,僅對早期的隱藏狀態(tài)進(jìn)行門控,從而消除了一半的查找操作。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

在單個 A100-80GB GPU 上,vLLM 測試顯示:對于 2K 提示詞加 32K 生成的場景,吞吐量比 Phi-4-mini-reasoning 提升高達(dá) 10 倍。各種提示詞長度下的端到端延遲平均降低約 2-3 倍。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

即使使用 256 個 token 的小滑動窗口,SambaY 在 Phonebook 32K 和 RULER 等困難檢索數(shù)據(jù)集上仍然超越了純 Transformer 基線。門控記憶單元保持新鮮的局部信息,而單個全注意力層提供全局覆蓋能力。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

邊緣設(shè)備教學(xué)應(yīng)用、離線數(shù)學(xué)助手,以及任何需要快速響應(yīng)且在嚴(yán)格內(nèi)存限制下運(yùn)行的設(shè)備端智能體,現(xiàn)在都有了一個即插即用的模型,能夠處理 64K token 和長鏈推理,無需服務(wù)器集群支持。

鏈接:?????https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning???

?

本文轉(zhuǎn)載自??AI帝國???????,作者:無影寺

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 日本a视频 | 91欧美精品成人综合在线观看 | 精品一区在线免费观看 | 欧美精品v国产精品v日韩精品 | www.久久| 日韩av一区二区在线观看 | 午夜精品一区二区三区在线视 | 可以在线观看av的网站 | 99精品视频一区二区三区 | 国产日韩欧美综合 | 四虎永久免费地址 | 美国黄色毛片 | 日韩在线精品视频 | 青青久久久 | 精品视频一区二区 | 夜夜爽夜夜操 | 国产精品久久久久一区二区三区 | 日韩欧美三区 | 欧美激情久久久 | 欧美日韩久久精品 | 日韩电影在线一区 | 欧美一区日韩一区 | 精精国产xxxx视频在线播放 | 国产日韩精品一区二区 | 亚洲一区二区三区在线免费观看 | 久久久国产一区二区三区 | 亚洲成av人片在线观看 | av中文字幕在线观看 | 性高湖久久久久久久久3小时 | 欧产日产国产精品视频 | 成年人网站免费 | 久久日韩精品一区二区三区 | 9999久久| 国产在线精品一区 | 欧美多人在线 | av片在线观看 | 亚洲欧洲精品一区 | 欧美国产日韩在线观看成人 | 久久69精品久久久久久国产越南 | 国产免费观看一级国产 | 求个av网址 |