成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

最強代碼模型刷新:Mistral新品上線即登頂,上下文窗口增至256k

人工智能
據介紹,新版 Codestral(2501)使用了更高效的架構和分詞器,生成速度比前一代大約快了 2 倍。在多個 Benchmark 當中,2501 版本都取得了 SOTA 的成績,代碼補全(FIM)能力也可圈可點。

“歐洲版 OpenAI” Mistral 的代碼模型 CodeStral,又上新了!

而且與 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 競技場第一名。

上下文窗口也增長到了之前的 8 倍,達到了 256k。

圖片

據介紹,新版 Codestral(2501)使用了更高效的架構和分詞器,生成速度比前一代大約快了 2 倍。

在多個 Benchmark 當中,2501 版本都取得了 SOTA 的成績,代碼補全(FIM)能力也可圈可點。

Mistral 的合作方 Continue.dev 聯創 Ty Dunn 還表示,Codestral 2501 標志著FIM領域的重大進步。

登頂代碼模型競技場,多種編程語言均是SOTA

在代碼模型競技場 Copilot Arena 上,CodeStral 2501 取得了第一名,與 Deepseek V2.5 以及 Claude 3.5 Sonnet 并列。

之后是 CodeStral 的上一個版本(2405),新版得分相比這一版提高了 12 分(1.2%)。

Llama 3.1、Gemini 1.5 Pro 和 GPT-4o 的排名則還要再靠后。

不過榜單當中沒有 o1,如果加進來對話可能形勢還會有所改變。

圖片

Copilot Arena 由卡內基梅隆大學和 UC 伯克利的研究人員與 LMArena 合作于去年 11 月推出。

它和我們更熟悉的 LLM 競技場很類似,由用戶出題并讓系統隨機選擇兩個模型匿名輸出,然后用戶根據輸出選擇優勝方。

Copilot Arena 可以看做是 LLM 競技場的代碼專用版本,不過同時它也是一款開源編程工具,可以在 VSCode 中同時讓多個模型同時生成,方便用戶“貨比三家”。

目前已經有 12 個代碼模型在 Copliot Arena 中進行過 PK,總共進行了 1.7 萬余場battle。

圖片

而根據 Mistral 官方曬出的成績單,CodeStral 2501 在 HumanEval 等傳統測試當中的多個指標上,也取得了 SOTA 的成績。

(按照 Mistral 的說法,選擇參與對比的模型是參數量 100B 以下且在 FIM 任務當中普遍被認為表現較好的模型。)

并且窗口長度也從 2405(參數量 22B)的 32k 增長到了 256k。

在 Python 語言和 SQL 數據庫的測試中,CodeStral 2501 在多個測試指標上都位列第一,其余位列第二。

圖片

其他語言方面(據宣傳 CodeStral 共支持 80+ 種語言),CodeStral 的 HumanEval 平均分為 71.4%,比第二名高出近 6 個百分點。

具體來看,在 Python、C+、JS 等多種常用語言中也都是 SOTA,并且實現了 C# 語言得分過半。

不過有意思的是,在 Java 上 CodeStral 2501 的成績相比前一代出現了下降。

圖片

除了生成,Mistral 團隊也發布了 CodeStral 2501 的 FIM 表現(單行精確匹配)

結果平均成績以及 Python、Java 和 JS 三個單項相比前一代均進步明顯,且優于 OpenAI FIM API(最新版是3.5 Turbo)等其他模型(不過緊隨其后的 DeepSeek 咬得很緊)

圖片

在 FIM 的 pass@1 當中,表現也是類似:

圖片

目前,CodeStral 2501 可以通過 Mistral 的合作方 Continue,在 VSCode 或 Jetbrains 系列 IDE 中使用。

當然動手能力強的用戶,也可以通過 API 自己來部署,價格是 0.3/0.9 美元或歐元每百萬輸入/輸出 token。

參考鏈接:
[1]https://x.com/lmarena_ai/status/1878872916596806069。
[2]https://mistral.ai/news/codestral-2501/。

責任編輯:姜華 來源: 量子位
相關推薦

2023-07-11 10:02:23

2024-03-29 12:49:00

AI訓練開源

2024-03-25 00:05:00

開源模型AI

2024-01-08 12:47:02

代碼模型Mistral

2023-10-11 13:21:12

模型數據

2024-07-19 12:45:23

2025-03-18 08:14:05

2023-08-10 14:04:15

代碼模型

2024-05-17 14:06:09

2017-05-11 14:00:02

Flask請求上下文應用上下文

2024-03-14 08:11:45

模型RoPELlama

2012-12-31 10:01:34

SELinuxSELinux安全

2024-01-29 08:49:36

RAG模型檢索

2025-03-18 09:10:00

MCPAI模型上下文協議

2022-09-14 13:13:51

JavaScript上下文

2025-06-11 04:25:00

上下文窗口系統

2023-11-22 16:51:53

2025-05-09 07:50:30

2023-07-28 12:13:28

模型語言性能

2025-03-10 18:50:57

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: aaa在线观看 | 久久精品色欧美aⅴ一区二区 | 久草成人| 久久久91 | 成年人视频在线免费观看 | 一本色道久久综合亚洲精品高清 | 不卡一区二区三区四区 | 精品婷婷 | 91亚洲精华国产 | 91www在线观看 | 日韩中文字幕一区二区 | 久久精品视频一区二区三区 | 国产一区二区影院 | 国产 日韩 欧美 制服 另类 | 狠狠操电影 | 精品国产乱码久久久久久图片 | 国产1页 | 国产午夜亚洲精品不卡 | 日韩一区二区福利视频 | 妞干网视频 | 亚洲va欧美va天堂v国产综合 | 国产精品成人国产乱 | 欧美一级片免费看 | 国产精品a级 | 欧美成人免费在线 | 国产精品毛片一区二区在线看 | 91视频免费视频 | 日韩欧美在线观看一区 | 99久久精品免费看国产四区 | 亚洲一区视频在线 | 精品国产一区二区三区性色 | 国产精品1区 | 日韩中文字幕区 | 国产成人免费视频 | 亚洲一区二区在线视频 | 在线免费观看黄色网址 | 日日骚网| 国产成人99久久亚洲综合精品 | 色偷偷噜噜噜亚洲男人 | 久久久不卡网国产精品一区 | 不卡一二三区 |