成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

小模型界o1來了:微軟推出Phi-4,數(shù)學推理能力太逆天!14B模型擊敗GPT-4o!還印證了AI墻的一個重要推斷

原創(chuàng) 精選
人工智能
AI公司越來越認識到,預訓練的燒錢帶來的價值在走低,尤其是在硬件資源有限的情況下,開發(fā)大規(guī)模預訓練模型可能難以為繼。不如守好自己的用戶,通過靈活的后期訓練和反饋迭代,扎實地做好AI產品的落地。

編輯 | 伊風  

出品 | 51CTO技術棧(微信號:blog51cto)

家人們,微軟Phi-4的數(shù)學能力太逆天了。誰看了不感慨一句:小模型才是未來!

8個月前,微軟發(fā)布了Phi-3,性能超過龐然大物Llama-3,狠狠驚艷了我們一把。

8個月后,Phi-4飛躍式突破,讓所有人知道誰才是小模型唯一的王!

圖片圖片

自幾個月前o1發(fā)布后,模型“搞定”數(shù)理化的能力已經飛升到博士級別,大模型也紛紛在推理能力上進行追趕。

而Phi-4祭出了小模型的王炸,14B小小模型,在數(shù)學推理上竟然反超多模態(tài)大模型Gemini Pro 1.5 兩分之多!

圖片圖片

在「AI撞墻」被熱烈討論的一天,微軟另辟蹊徑,似乎告訴AI公司:別再傻傻地Scaling了!

1.14B小模型,也能懂數(shù)學推理!

Phi-4確實可以進行思維推理!

在微軟給的案例中,Phi-4在解題過程中展現(xiàn)了清晰的推理鏈條,成功解決了蝸牛難題!

圖片圖片

問題:在一場由 5 只蝸牛參加的比賽中,最多可能出現(xiàn)一場平局,但平局可以涉及任意數(shù)量的蝸牛。例如,比賽結果可能是 Dazzler 獲得第一名,Abby、Cyrus 和 Elroy 并列第二,Bruna 獲得第五名。那么,比賽的可能結果總共有多少種?

Phi-4根據(jù)題干,先計算了沒有平局出現(xiàn)的情況,為120種。

然后在有一場平局的情況中,繼續(xù)按照“選擇 k 只蝸牛組成平局組”的思路分解問題,最終得出了正確回答。

這一能力表明,Phi-4在科學研究、工程和金融建模等領域未來可期!

也讓我們對端側模型的未來更加期待了!對于許多應用來說,這種針對性的卓越性能比大型模型的廣泛但較低效的能力更有價值得多。

2.模型訪問:azure獨家首發(fā),下周登陸抱抱臉

比較可惜的是,Phi-4目前的可用性有限。

獨家首發(fā)在了微軟自家的Azure AI Foundry上使用,更多的面向科研用途。地址:

https://ai.azure.com/explore/models?&selectedCollectinotallow=phi

不過,按照計劃下周會在Hugging Face平臺上線。

這也算是微軟在用Phi-4這張王牌,給Azure AI Foundry“引流”了。

Azure AI Foundry在去年推出,作為一個集中管理的中心,旨在幫助企業(yè)級用戶管理項目、微調AI模型,并訪問Azure AI服務。

在Phi-4技術報告中,還提到了該平臺獨特的內容安全功能。主要包括:

  • Prompt Shields(提示保護):幫助應對潛在的提示攻擊。
  • 受保護內容檢測:識別敏感或受限制的材料。
  • Groundedness Detection(扎實性檢測):確保生成內容有據(jù)可依。

3.AI墻絕不是危言聳聽:已逼近預訓練數(shù)據(jù)墻!

在Phi-4的報告中,Phi系列在性能上的“極致一躍”,被歸功于合成數(shù)據(jù)和后期訓練的提高和改進。

“在數(shù)學推理方面,Phi-4 的表現(xiàn)優(yōu)于同類和更大型的模型,這得益于整個流程的進步,包括高質量合成數(shù)據(jù)集的使用、高質量有機數(shù)據(jù)的整理以及后期訓練的創(chuàng)新。”

圖片圖片

Phi展現(xiàn)了模型界的一種趨勢,也反映著預訓練的尷尬之處:大規(guī)模的預訓練,通常需要海量的數(shù)據(jù)和計算資源。隨著硬件能力的提升和模型規(guī)模的擴大,雖然模型性能逐漸增強,但增益的邊際效應越來越小,即每次訓練的優(yōu)化效果趨于減弱。

Scale AI 首席執(zhí)行官Alexandr Wang周四在一條推文中說:"我們已經達到了預訓練數(shù)據(jù)墻。"

圖片圖片

國內則更早展現(xiàn)了這個趨勢的“風聲”。此前報道,國內大模型“六小虎”中至少有兩家公司已經放棄了預訓練,開始專注于AI應用層。

AI公司越來越認識到,預訓練的燒錢帶來的價值在走低,尤其是在硬件資源有限的情況下,開發(fā)大規(guī)模預訓練模型可能難以為繼。不如守好自己的用戶,通過靈活的后期訓練和反饋迭代,扎實地做好AI產品的落地。

另外,還有一個小插曲,Phi-4是微軟Phi系列核心人物布貝克(Sébastien Bubeck),被OpenAI挖走后的首次更新!

圖片圖片

在 2024 年加入 OpenAI 之前,Bubeck 在微軟研究院工作了近十年,離職前為微軟的人工智能副總裁。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區(qū)

http://m.ekrvqnd.cn/aigc/



責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2024-12-23 09:38:00

2024-11-28 15:51:19

GPT-4o微軟

2024-10-17 14:05:34

2025-05-08 16:45:32

開源Phi-4推理模型

2024-12-26 07:10:00

2024-09-29 13:07:16

2025-05-26 09:05:00

2025-05-27 15:59:41

AI工具模型

2025-01-21 10:10:56

2024-10-17 13:30:00

2025-01-02 13:00:00

2025-02-28 09:32:00

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2025-02-27 13:45:00

2024-06-05 13:09:26

2024-05-30 12:50:05

2024-07-04 15:26:56

2024-05-15 17:34:15

2024-11-25 08:30:00

2024-07-24 13:18:17

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美在线视频不卡 | 日韩欧美一级片 | 久久久久久久亚洲精品 | 日本成人在线观看网站 | 欧美激情99 | 欧美激情一区二区三区 | 777zyz色资源站在线观看 | 日韩有码一区 | 久久伊人影院 | 日韩中文字幕在线观看 | 日本视频在线 | 在线免费观看黄a | 激情久久久久 | 中国一级特黄真人毛片免费观看 | 午夜影院 | 久久久久久国产精品 | 亚洲日本一区二区三区四区 | 久久久精品日本 | 国产偷久久一级精品60部 | 久久久不卡网国产精品一区 | 涩色视频在线观看 | 少妇诱惑av | 日韩乱码在线 | 久久久久国产精品午夜一区 | 欧美xxxx色视频在线观看免费 | 人人澡人人爱 | 精品久久香蕉国产线看观看亚洲 | 国产乱码精品一品二品 | 亚州中文字幕 | 91精品国产乱码久久久久久久久 | 久久成 | 中日av | 2021天天干夜夜爽 | 福利网站导航 | 久久久久黑人 | a级黄色毛片免费播放视频 国产精品视频在线观看 | 中文字幕视频在线观看免费 | 操视频网站| 日韩国产一区二区三区 | 99福利视频 | 欧美一区精品 |