成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<video id="61616"></video>

<strike id="61616"></strike>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

中國開源大模型新成員：小米推理大模型首秀！原創(chuàng)

發(fā)布于 2025-4-30 17:06

瀏覽

0收藏

編輯 | 云昭

進入2025以來，中國大模型的開源力量一騎絕塵，甚至蓋過了Llama的勢頭。今天，中國開源大模型，迎來新成員！

4月30日，趕在五一前，一條“為Reasoning而生”的Xiaomi Mimo開源模型的發(fā)布消息不脛而走，發(fā)布渠道是小米6天前新注冊的公眾號Xiaomi Mimo。

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

據悉，Xiaomi Mimo模型是小米公司剛成立不久的LLM-Core團隊（據傳去年12月底開始成立）的成果首秀。

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

模型參數只有7B，卻在代碼、數學能力戰(zhàn)勝了OpenAI的o1-mini和阿里的Qwen-32B，并展現出了超越經典開源32B模型的強化學習的潛力。

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

短短幾個月的時間，就能做出這樣的成績，屬實不易。

1.那么，究竟怎樣做到的呢？

據悉，MiMo推理能力的提升，得益于團隊在預訓練和后訓練的數據和算法方面的多層組合創(chuàng)新努力。

具體來講，預訓練方面：就是讓模型領略更多的推理模型，后訓練方面重點就是打磨高效穩(wěn)定的強化學習算法和框架。

具體關鍵做法如下：

(1)預訓練

數據上，著重挖掘富推理語料，并合成約200B tokens推理數據。訓練上，進行了三階段訓練，逐步提升訓練難度，總訓練25T tokens。

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

(2)后訓練

主打高效穩(wěn)定的RL訓練。比如在算法方面提出了 Test Difficulty Driven Reward 來緩解困難算法問題中的獎勵稀疏問題，并引入 Easy Data Re-Sampling 策略，以穩(wěn)定 RL 訓練；在框架方面設計了Seamless Rollout系統(tǒng)，使得RL訓練加速2.29倍，驗證加速1.96倍。

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

技術細節(jié)還有很多，比如使用改進的組相對策略優(yōu)化（GRPO）算法進行訓練，包括移除KL損失、動態(tài)采樣和增加上界裁剪等策略；提出測試難度驅動的獎勵機制，將測試用例按難度分組，并根據難度分配獎勵；采用易數據過濾和重采樣策略，提高采樣效率并穩(wěn)定策略更新等等，這里不再一一展開。

技術報告也已經同步在Github上，鏈接：??https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf??感興趣的朋友強烈建議一讀。

2.全系列模型開源

MiMo-7B 已開源4個模型至HuggingFace：??https://huggingface.co/XiaomiMiMo??

中國開源大模型新成員：小米推理大模型首秀！-AI.x社區(qū) 圖片

3.小米的大模型野心

小米作為移動互聯網時代的佼佼者，同其他科技巨頭一樣，很早就在AI方面做了布局。

例如早在2016年，小米便組建起了第一支視覺AI團隊。隨即2017年，小米AI實驗室成立，為小米在AI技術的探索和創(chuàng)新提供了重要平臺。

但真正讓小米管理班子下決心做大模型的時間點是2023年。2023年，小米成立大模型團隊，將“輕量化、本地部署”定為小米大模型技術的主要突破方向。

同年8月，雷軍在演講《成長》中宣布：小米進行科技戰(zhàn)略升級，把AI放到了核心位置，同時提出了“深耕底層技術、長期持續(xù)投入、軟硬深度融合，AI全面賦能”的原則，計劃未來五年在12個技術領域、99個細分賽道投入1000億用于技術研發(fā)。

據悉，小米的AI團隊規(guī)模已超過3000人，覆蓋了視覺、聲學、語音、NLP、知識圖譜、機器學習、大模型、多模態(tài)等多個前沿方向，推動著AI技術全面賦能手機、AIoT、汽車、機器人等多個業(yè)務板塊。

但進入大模型時代以后，模型底座的重要性越來越得到凸顯，一方面DeepSeek R1用實力證明了千億參數以下的模型也可以用較低成本的方式獲得不亞于o1的推理效果，技術路徑得到驗證；另一方面，上層AI應用的同質化的確在用戶忠誠度方面拉不開距離。

這也是為什么小米堅決在大模型底層做投入的原因。只有具備自己的大模型，才能讓昔日的互聯網王者有底氣留在未來的大模型牌桌上。

Mimo團隊是一個年輕的團隊，而且今天發(fā)布的模型也不是市面上性能最為先進的，畢竟只有7B的大小，能PK掉Qwen-32B和o1-mini，可以說試一次不錯的技術路徑的驗證。

這是一個很好的階段性成果，不難預料，Mimo2對標的將會是o3、o4-mini。

這似乎是小米Mimo團隊的不太遙遠的“野望”！

正如小米新注冊的這個公眾號的slogan：Ask Mi Anything！

參考鏈接：??https://mp.weixin.qq.com/s/Sx48m4tTTc6bJzMLU5scbQ??

本文轉載自??51CTO技術棧??，作者：云昭

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

社區(qū)頭條

回復

相關推薦

Google開源大模型新成員CodeGemma、RecurrentGemma，繼Transformer后新架構Griffin誕生

AIGC最前線 ? 3984瀏覽 ? 0回復
醫(yī)療大模型，巨頭們的新賽場

liutao988 ? 2310瀏覽 ? 0回復
KubeAI大模型推理加速實踐

卓勝微wjp ? 3508瀏覽 ? 0回復
騰訊PCG自研高性能大語言模型推理引擎「一念LLM」正式開源

輕薄滴假象 ? 3939瀏覽 ? 0回復
單個4090可推理，2000億稀疏大模型「天工MoE」開源

輕薄滴假象 ? 2586瀏覽 ? 0回復
直播首秀 AI大模型的存儲之道

數字化助推器 ? 2745瀏覽 ? 0回復
大模型的條件推理和模態(tài)推理

xuxiangda ? 3447瀏覽 ? 0回復
幾何視角下的大語言模型推理

sbf_2000 ? 2654瀏覽 ? 0回復
英偉達開源新大模型：訓練數據減少40倍，算力節(jié)省1.8倍

Aceryt ? 3217瀏覽 ? 0回復
超越CLIP，視覺大模型訓練新范式？

kede96 ? 2422瀏覽 ? 0回復
五大主流開源大模型RAG評估框架詳解

玄姐聊AGI ? 7239瀏覽 ? 0回復
OPEN-RAG：利用開源大模型增強檢索增強推理

大模型自然語言處理 ? 2562瀏覽 ? 0回復
智譜大秀肌肉！CogAgent 2.0讓大模型接管一切！GLM-PC首創(chuàng)隱形屏幕，人類監(jiān)工AI不遠了

51CTO技術棧 ? 2590瀏覽 ? 0回復
DeepSeek 關鍵骨干羅福莉已離職加入小米，或領軍小米大模型團隊

51CTO技術棧 ? 5446瀏覽 ? 0回復
多模態(tài)大模型Reyes增加batch推理方式，提升推理速度

大模型自然語言處理 ? 2354瀏覽 ? 0回復
Unsloth開源新算法：讓GRPO訓練大模型所需顯存降低90%，告別顯存焦慮！

sbf_2000 ? 3222瀏覽 ? 0回復
Search-R1：讓大模型學會“檢索+推理”的新范式

arnoldzhw ? 1956瀏覽 ? 0回復
大模型推理能力的局限性

JavaEdge1 ? 1603瀏覽 ? 0回復
小米殺入推理大模型賽道！MiMo-7B以小搏大，數學代碼雙殺32B參數巨頭

算家計算 ? 1044瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

從播客到帶娃，看老黃、納德拉、奧特曼這些CEO 如何在生活中使用 AI 14h前發(fā)布
Claude含AI量超Cursor一倍！資深工程主管揭秘AI編碼真相！谷歌謹慎全搞自研 15h前發(fā)布

熱門推薦

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

Devin聯合創(chuàng)始人：別搞多智能體系統(tǒng)！微軟和OpenAI鼓吹的代理構建理念大錯特錯！ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

AI Agents開源工具棧全解析~ 0回復

上一篇：剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！

下一篇： 90%的AI產品發(fā)布，為什么慘敗如垃圾！

社區(qū)精華內容

目錄

主站蜘蛛池模板：九九色综合 | 午夜在线精品偷拍 | 中文字幕视频一区 | 性视频一区 | 成人午夜在线 | 精久久 | 亚洲美女网站 | 影音先锋中文字幕在线观看 | 日韩精品在线一区 | 国产又色又爽又黄又免费 | 欧美性久久久 | 久久精品免费看 | 大学生a级毛片免费视频 | 一区二区三区四区在线免费观看 | 亚洲一区二区三区四区五区午夜 | 男人天堂久久久 | 亚洲a网 | 无码日韩精品一区二区免费 | 久久精品久久久久久 | 涩涩操 | 久久精品国产亚洲 | 久草免费在线视频 | 欧美色综合网 | 黄色三级毛片 | 欧美久久一区二区三区 | 99久久日韩精品免费热麻豆美女 | 欧美国产日韩在线 | 最新一级毛片 | 亚洲综合视频一区 | 成人一区二区三区在线观看 | 中文字幕国产 | 欧美成人一区二免费视频软件 | 国产精品一区二区三区在线 | 777毛片| 亚洲成人自拍 | 国产精品日韩欧美一区二区三区 | 天堂一区二区三区 | 99热首页| 欧美一级在线免费 | 亚洲国产aⅴ成人精品无吗综合国产在线 | 人人九九精|

<tfoot id="11616"><label id="11616"><label id="11616"></label></label></tfoot>

<input id="11616"></input>