成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5%參數比肩DeepSeek滿血R1!北大“小”模型靠分合蒸餾,打破推理成本下限

人工智能 新聞
北京大學楊仝教授團隊近期發布了其在高效大型語言模型研究方向的一項新成果——FairyR1-32B模型。

只用5%的參數,數學和代碼能力竟然超越滿血DeepSeek?

北京大學楊仝教授團隊近期發布了其在高效大型語言模型研究方向的一項新成果——FairyR1-32B模型

該模型基于DeepSeek-R1-Distill-Qwen-32B基座,通過結合微調與模型合并技術構建。

研究探索了在參數量大幅減少的情況下,模型在特定任務上實現與更大模型相當甚至更優性能的可能性。

以上模型已在Huggingface開源

模型地址:https://huggingface.co/PKU-DS-LAB/FairyR1-32B

FairyR1-32B模型解析

FairyR1-32B模型是在團隊前期TinyR1工作基礎上進行的進一步探索,沿用了“分合蒸餾”的研究思路,提出了多種改進方法,包括自我合并多教師交叉蒸餾輕蒸餾等方法,并在數據處理進行了優化,模型精度有了顯著提升。

本次工作重點改進了蒸餾數據的構建流程,對來源于AI-MO/NuminaMath-1.5(數學)open-thoughts/OpenThoughts-114k(代碼)等數據集的原始數據,通過多個“教師模型”生成答案,隨后對問答數據進行精心篩選、結構調整與思維鏈優化,并進行多階段篩選。

篩選過程包括基于答案的正確性驗證(針對數學數據),以及基于長度的篩選(數學數據保留2k-8k tokens范圍,代碼數據保留4k-8k tokens范圍),最終構建了更具針對性的約6.6k條數學數據和約3.8k條代碼數據用于訓練。

在模型結構方面,研究團隊嘗試訓練兩個領域(數學和代碼)的專業模型進行合并,旨在進一步優化流程和資源消耗。

這兩個專業模型在一致的訓練參數下(例如相同的學習率和批次大小)獨立訓練約5個周期后,利用AcreeFusion工具進行了合并。

實驗結果

在多個公開基準測試中,FairyR1展現出了在低參數量下的競爭力表現。以下為FairyR1與DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基準上的得分對比:

基準測試

DeepSeek-R1-671B(滿血版)

DeepSeek-R1-Distill-Qwen-32B

FairyR1-32B   (北京大學)

數學能力AIME 2024

79.8

72.6

80.4

數學能力AIME 2025

70.0

52.9

75.6

代碼能力LiveCodeBench

65.9

57.2

67.7

科學問答能力GPQA-Diamond

71.5

62.1

59.6

從測試結果可以看出,FairyR1-32B在AIME 2025和LiveCodeBench基準上得分略高于DeepSeek-R1-671B,在AIME 2024上表現接近。在GPQA-Diamond科學基準上,FairyR1的得分低于DeepSeek-R1-671B。

這些結果表明,FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并經過特定技術處理后,能夠在約5%參數量的情況下,在數理和編程等領域實現與大型模型相當或略優的性能水平,但在科學等其他領域可能存在差距。

這項工作探索了通過優化的數據處理和模型融合技術,在保證特定任務性能的前提下,大幅降低模型規模和潛在推理成本的可能性。

北京大學楊仝教授團隊表示:“FairyR1-32B模型是我們探索高效大型語言模型技術路線的階段性成果。通過對蒸餾和合并方法的改進,我們初步驗證了在有限資源下實現高性能模型的可行性。”

團隊成員:李旺、周俊廷、劉文睿、姚一倫、王融樂、楊仝

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-06 17:29:21

2025-02-25 08:20:50

AI程序員DeepSeek

2025-03-06 10:14:39

2025-03-06 09:55:49

2025-02-25 14:50:16

2025-03-11 02:00:00

AI工具Token-AI

2025-03-07 08:50:03

2025-02-17 09:33:00

AI算法模型

2025-01-27 12:30:07

2025-02-10 06:50:00

AIDeepSeek推理模型

2025-03-27 10:28:32

2025-02-27 00:00:05

2025-02-20 15:32:28

2025-03-03 08:17:00

DeepSeek模型數據

2025-03-03 00:04:00

DeepSeek教程部署

2025-03-07 08:30:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产高潮好爽受不了了夜色 | av在线一区二区 | 天天操夜夜爽 | 一区二区在线免费观看 | 亚洲精品一区中文字幕乱码 | 亚洲视频免费播放 | 国产在线视频一区 | 瑞克和莫蒂第五季在线观看 | 成人在线播放 | 毛片毛片毛片毛片毛片 | 日本xx视频免费观看 | 亚洲国产成人在线 | 精品欧美一区二区在线观看视频 | 亚洲欧美在线一区 | 欧美精品片 | 日日操天天射 | 欧美视频在线看 | 亚洲一区二区三区免费在线观看 | 免费不卡视频 | 欧美日韩国产一区二区 | 99精品欧美一区二区三区综合在线 | 999久久久久久久久6666 | 欧美不卡一区 | 福利精品在线观看 | 青青久在线视频 | 欧美日韩一区二区三区四区五区 | 久久精品一区二区视频 | www精品美女久久久tv | 99亚洲精品 | 99久久夜色精品国产亚洲96 | 97国产精品视频人人做人人爱 | 国户精品久久久久久久久久久不卡 | 国产精品无码专区在线观看 | 亚洲欧美日本国产 | 欧美黄 片免费观看 | 国产成人精品一区二 | 亚洲精品第一国产综合野 | 中文字幕亚洲视频 | 91精品国产乱码久久久久久 | 亚洲中午字幕 | 亚洲美女视频 |