成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

超越Claude 3.5緊追o1!DeepSeek-V3-Base開(kāi)源,編程能力暴增近31%

人工智能 新聞
DeepSeek-V3-Base 采用了 685B 參數(shù)的 MoE 架構(gòu),包含 256 個(gè)專家,使用了 sigmoid 路由方式,每次選取前 8 個(gè)專家(topk=8)。

在 2024 年底,探索通用人工智能(AGI)本質(zhì)的 DeepSeek AI 公司開(kāi)源了最新的混合專家(MoE)語(yǔ)言模型 DeepSeek-V3-Base。不過(guò),目前沒(méi)有放出詳細(xì)的模型卡。

圖片


圖片

  • HuggingFace 下載地址:https://huggingface.co/DeepSeek-ai/DeepSeek-V3-Base/tree/main

具體來(lái)講,DeepSeek-V3-Base 采用了 685B 參數(shù)的 MoE 架構(gòu),包含 256 個(gè)專家,使用了 sigmoid 路由方式,每次選取前 8 個(gè)專家(topk=8)。


圖片

圖源:X@arankomatsuzaki

該模型利用了大量專家,但對(duì)于任何給定的輸入,只有一小部分專家是活躍的,模型具有很高的稀疏性。


圖片

圖源:X@Rohan Paul

從一些網(wǎng)友的反饋來(lái)看,API 顯示已經(jīng)是 DeepSeek-V3 模型。

圖片

圖源:X@ruben_kostard

同樣地,聊天(chat)界面也變成了 DeepSeek-v3。

圖片

圖源:X@Micadep

那么,DeepSeek-V3-Base 性能怎么樣呢?Aider 多語(yǔ)言編程測(cè)評(píng)結(jié)果給了我們答案。

先來(lái)了解一下 Aider 多語(yǔ)言基準(zhǔn),它要求大語(yǔ)言模型(LLM)編輯源文件來(lái)完成 225 道出自 Exercism 的編程題,覆蓋了 C++、Go、Java、JavaScript、Python 和 Rust 等諸多編程語(yǔ)言。這 225 道精心挑選的最難的編程題給 LLM 帶來(lái)了很大的編程能力挑戰(zhàn)。

該基準(zhǔn)衡量了 LLM 在流行編程語(yǔ)言中的編碼能力,以及是否有能力編寫可以集成到現(xiàn)有代碼的全新代碼。

從下表各模型比較結(jié)果來(lái)看,DeepSeek-V3-Base 僅次于 OpenAI o1-2024-12-17 (high),一舉超越了 claude-3.5-sonnet-20241022、Gemini-Exp-1206、o1-mini-2024-09-12、gemini-2.0-flash-exp 等競(jìng)品模型以及前代 DeepSeek Chat V2.5。

其中與 V2.5(17.8%)相比,V3 編程性能暴增到了 48.4%,整整提升了近 31%。

圖片


圖片

另外,DeepSeek-V3 的 LiveBench 基準(zhǔn)測(cè)試結(jié)果也疑似流出。我們可以看到,該模型的整體、推理、編程、數(shù)學(xué)、數(shù)據(jù)分析、語(yǔ)言和 IF 評(píng)分都非常具有競(jìng)爭(zhēng)力,整體性能超越 gemini-2.0-flash-exp 和 Claude 3.5 Sonnet 等模型。

圖片

圖源:reddit@homeworkkun

HuggingFace 負(fù)責(zé) GPU Poor 數(shù)據(jù)科學(xué)家 Vaibhav (VB) Srivastav 總結(jié)了 DeepSeek v3 與 v2 版本的差異:

根據(jù)配置文件,v2 與 v3 的關(guān)鍵區(qū)別包括:

  • vocab_size:v2: 102400 v3: 129280 
  • hidden_size:v2: 4096 v3: 7168
  • intermediate_size:v2: 11008 v3: 18432
  • 隱藏層數(shù)量:v2:30 v3:61  
  • 注意力頭數(shù)量:v2:32 v3:128  
  • 最大位置嵌入:v2:2048 v3:4096

v3 看起來(lái)像是 v2 的放大版本。

圖片

圖源:X@reach_vb

值得注意的是,在模型評(píng)分函數(shù)方面,v3 采用 sigmoid 函數(shù),而 v2 采用的是 softmax 函數(shù)。

網(wǎng)友熱評(píng):開(kāi)源模型逼近 SOTA

眾多紛紛網(wǎng)友表示,Claude 終于迎來(lái)了真正強(qiáng)勁的對(duì)手,甚至在一定程度上 DeepSeek-V3 可以取代 Claude 3.5。

圖片


圖片

還有人感嘆道,開(kāi)源模型繼續(xù)以驚人的速度追趕 SOTA,沒(méi)有放緩的跡象。2025 年將成為 AI 最重要的一年。

圖片

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-02-03 14:17:27

2024-11-25 12:50:14

2025-01-26 08:40:00

AI模型預(yù)測(cè)

2024-12-27 09:50:00

模型數(shù)據(jù)測(cè)試

2025-02-19 13:50:00

明星編程軟件

2024-10-23 09:20:00

2024-12-26 14:42:23

2024-11-21 14:00:00

模型AI

2024-12-31 12:35:46

2024-12-09 08:00:00

AI大模型人工智能

2025-03-05 10:21:04

DeepSeekLVLM

2025-01-20 08:46:00

代碼測(cè)試模型

2025-02-19 15:40:00

OpenAI編程模型

2025-06-17 17:14:01

DeepSeekSOTA開(kāi)源

2025-04-29 09:06:00

2024-12-16 09:00:00

AI架構(gòu)訓(xùn)練

2024-10-24 14:02:43

2025-02-10 08:37:04

2025-05-30 01:00:00

2025-02-12 12:04:54

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 福利视频一区二区三区 | 色婷婷综合久久久中字幕精品久久 | 中文字幕视频三区 | 草久久 | 久久国产精品久久久久久 | 亚洲视频网 | 欧美在线观看一区 | 日本精品裸体写真集在线观看 | 亚洲欧美综合 | 91麻豆精品国产91久久久久久 | 欧美精品黄 | 国产成人精品免费视频大全最热 | 欧美精品一二区 | 视频一区二区在线观看 | 男人天堂视频在线观看 | av大片在线 | 蜜桃精品视频在线 | 中文字幕亚洲欧美 | 国产精品久久久久久久久久不蜜臀 | 久久天堂网 | 久久网一区二区三区 | 国产精品a久久久久 | 福利视频亚洲 | 一区二区视屏 | 999精品视频 | 免费一级毛片 | 午夜免费精品视频 | 黄色精品视频网站 | 福利影院在线看 | 久久99精品久久久久久国产越南 | 一级毛片视频免费观看 | 亚洲精品在线观看网站 | 日韩成人在线视频 | 久久中文字幕电影 | 欧美三级在线 | 97精品超碰一区二区三区 | 国产一级片一区二区 | 羞羞网站在线观看 | 亚洲天堂精品一区 | 午夜天堂精品久久久久 | 日韩一区二区在线视频 |