成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

最壕DeepSeek玩家8臺Mac跑R1,10萬+元湊496GB顯存才能跑4bit量化版

人工智能 新聞
花30秒用manim代碼制作解釋勾股定理的動畫,一次完成無錯誤。

DeepSeek-R1,正在接受全球網友真金白銀的檢驗。

花30秒用manim代碼制作解釋勾股定理的動畫,一次完成無錯誤。

圖片

為了玩上這樣的模型,有人花上10多萬元,組7臺M4 Pro Mac mini+1臺M4 Max Macbook Pro的家用超算。

圖片

總計496G顯存(64*7+48),才能跑起個4bit量化版,但屬實算得上“家用AGI”配置了。

圖片

另一個極端是選擇R1數據蒸餾版Qwen 1.5B小模型,小到瀏覽器就能跑,每秒能輸出60個tokens。

圖片

與此同時,各種榜單也在抓緊測試,紛紛跑出了結果。

R1橫掃各大榜單

首先是LiveBench,與LiveCodeBench一樣,題目是隨時間更新的,所以相對受認可。

R1的表現在o1-preview到o1之間,其中只有數據一項超過o1。

圖片

不過再帶上成本成本約1/30這個條件看,又是不一樣的感覺,給老哥整無語了。

唯一的抱怨是上下文窗口太短。

圖片

o1系列一戰成名的ARC-AGI,測試結果分為公開數據和私有數據兩部分。

DeepSeek R1在私有數據上解決了15.8%的問題,與DeepSeek-V3相比翻倍還多。

公開數據上更是解決了20.5%的問題,與DeepSeek-V3相比上漲約46%。

圖片

總的來看,DeepSeek-R1表現與o1-preview相近,但稍低。

圖片

但同樣,帶上幾毛錢就能解決一道題,o1系列至少要10塊錢這個背景來看,又是不一樣的感覺。

圖片

考驗任務規劃能力的PlanBench,同樣的劇本再次上演。

圖片

在開發者Xeophon自己的個人測試上,甚至超過了o1-preview。

圖片

同一個測試上,R1數據蒸餾的Qwen 32B,與DeepSeek-V3,GPT-4o和Gemini Flash處于同一水平。

圖片

最后,還有人從中看到新的創業機會。

誰來構建一個平臺,能輕松地在DeepSeek R1上進行OpenAI風格的強化微調。

至少在短期內,是一個巨大的機會。

R1在正確數據和微調方法下,可能在特定任務上大幅提升。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-13 12:41:37

2025-06-03 08:49:00

2025-02-27 00:00:05

2025-01-27 12:30:07

2025-04-30 09:16:00

2025-02-07 13:10:06

2025-03-12 10:41:34

2025-02-25 08:20:50

AI程序員DeepSeek

2025-02-20 15:32:28

2025-03-10 13:11:26

2025-04-03 15:57:48

2025-06-16 08:11:47

2025-02-06 08:06:05

2024-11-08 10:00:00

AI模型

2025-02-11 08:35:30

2024-04-23 13:10:41

數據訓練

2015-08-20 09:13:11

Windows 10內存

2025-02-10 09:31:29

2025-02-08 11:31:17

DeepseekR1模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人福利网站 | 免费观看的黄色网址 | 久久艹av| 欧美激情综合五月色丁香小说 | 日本免费黄色 | 精品一区二区视频 | 日日夜夜狠狠操 | 日韩综合一区 | 日韩欧美一级精品久久 | 国产精品久久久久一区二区三区 | 国产一区高清 | 亚洲aⅴ| 欧美一级片黄色 | 国产欧美在线视频 | 久久久久国产精品一区二区 | 精品日韩一区 | 99国产精品久久久 | 成人h电影在线观看 | 国产精久久久久久 | 日本在线一区二区三区 | 亚洲国产日韩一区 | 亚洲一区免费 | 一区二区日韩 | 久久国产综合 | 久草视频在 | 成人在线日韩 | 三级视频国产 | 欧美极品一区二区 | 成人午夜看片 | 日本精品一区二区在线观看 | 成人黄色电影在线播放 | 久久i | 91成人免费看 | 中文字幕在线一区二区三区 | 欧美国产精品久久久 | 2023亚洲天堂 | 日本免费视频在线观看 | 一区视频 | 久久国产一区二区 | 色婷婷综合网站 | 人人干人人干人人 |