速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言

duhorse

發布于 2024-5-30 13:32

瀏覽

0收藏

真正Open的AI公司Mistral又低調上新了。

這次，他們發布了首款代碼生成模型Codestral，支持80多種編程語言以及32K長上下文窗口。

不僅在基準測試上取得了驚艷的表現，而且代碼生成的速度也讓試用的網友非常滿意。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

目前，Codestral提供了多種API，而且模型權重也公開在HuggingFace上。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

項目地址：https://huggingface.co/mistralai/Codestral-22B-v0.1/tree/main

代碼生成新SOTA

Codestral的訓練數據包含80多種編程語言，包括最流行的Python、Java、C、C++和Bash，以及HTML、JavaScript等前端語言，在Swift和Fortran上也有良好表現。

模型可以完成的任務包括編寫特定功能的函數、編寫測試，以及代碼填充。

此外，由于Codestral同時精通英語，也可以與開發人員進行交互，有助于提高工程師的編碼水平并減少錯誤和漏洞。

可以通過Le Chat對話界面免費使用模型的交互功能。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

在線地址：?https://chat.mistral.ai/chat??

作為一個參數量只有22B的模型，Codestral實現了32K的長上下文窗口，是Llama 3 70B的四倍。

Codestral使用了Llama架構，但在7種語言的HumanEval均分超過了CodeLlama，可以和Llama 3打個平手。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

RepoBench是一個用于評估存儲庫級代碼補全任務的新基準，考驗模型的跨文件檢索和理解長上下文能力。在RepoBench上，Codestral使用Python語言達到了SOTA成績。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

此外，在其他語言的評估中，包括C++、bash、Java、PHP、Typescript和C#，Codestral也取得了不錯的成績。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

FIM基準可以評估模型在中間填充任務上的性能，但CodeLlama和Llama不直接支持這個功能。

在FIM任務中，Codestral用更少的參數量，在Pyhon、JavaScript和Java三種語言上的分數全面超過DeepSeek Coder 33B。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

目前，Mistral開放了兩個API供開發者調用Codestral，分別是codestral.mistral.ai和api.mistral.ai，前者有8周的免費測試期，后者按token收費。

此外，還可以通過Continue.dev或者Tabnine插件在VSCode或JetBrains的IDE中使用Codestral的功能。

開發者們已經用上了

基準測試畢竟只是參考，代碼工具好不好用，只有試過才知道。

有網友感嘆「80種語言太瘋狂了」「終于有人想起來Swift了」。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

而且實測中可以看到，Codestral的代碼生成速度非常快，而且響應延遲也很短。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

有人給了GPT-4o和Codestral相同的任務，讓它們用Go語言實現基本的發布/訂閱系統。

雖然兩個模型的響應延遲都很短，但Codestral寫完的時候，GPT-4o剛寫到一半，生成速度高下立現。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

有開發者分析，雖然Codestral不是最大、最好的代碼模型，但自己還是會從Claude Opus爬墻，改用Codestral。

因為模型確實包含了更多前沿知識，可以幫助編寫最新的AI代碼，但ChatGPT和Opus都做不到。

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

但也有Python工程師吐槽：「沒有一個LLM明白，在Python 3.9之后的版本中，就不再需要使用from typing import List了。」

「GPT-4、GPT-4o、Claude Opus、Gemini和Codestral都無法理解這一點。即使明確說明，它們仍然無法理解。」

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言-AI.x社區

看來人類程序員剩下的為數不多的優勢還有「知錯就改」。

本文轉自新智元，作者：新智元

原文鏈接:??https://mp.weixin.qq.com/s/4dN_oEgUHyJLcRVygKKabw??

標簽

代碼

生成模型

贊

回復

舉報

回復

相關推薦

Mistral開源8X22B大模型，OpenAI更新GPT-4 Turbo視覺，都在欺負谷歌

輕薄滴假象 ? 2690瀏覽 ? 0回復
GPT-4o 的數學又雙叕進步了？來 MathBench 看看新版 GPT-4o 到底強在哪！

戀戀青鳥 ? 3618瀏覽 ? 0回復
?天下武功唯快不破，GPT-4o真的牛

ermulong ? 2422瀏覽 ? 0回復
AutoCoder：性能超越GPT-4o的模型，居然只有33B，還是開源！

大語言模型論文跟蹤 ? 7342瀏覽 ? 0回復
Mistral 開源代碼模型奪得王座！Codestral瘋狂訓練超80種語言，國內通義開發者請求出戰！

51CTO技術棧 ? 3303瀏覽 ? 0回復
GPT-4o背后可能的語音技術

魚蟲子 ? 3496瀏覽 ? 0回復
超越GPT-4o，Claude 3.5一夜封王！10倍編碼速度逆天，全網最全實測來了

duhorse ? 4484瀏覽 ? 0回復
對標GPT-4o！不鎖區、支持手機、免費使用，Moshi來啦！

Aceryt ? 3212瀏覽 ? 0回復
Mistral開源首個多模態大模型—Pixtral 12B

Aceryt ? 2885瀏覽 ? 0回復
阿里史上最大規模開源發布，超GPT-4o 、Llama-3.1！

Aceryt ? 2460瀏覽 ? 0回復
擊敗GPT-4o、僅次于o1！英偉達重磅開源超強大模型--Nemotron

Aceryt ? 3370瀏覽 ? 0回復
重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！

51CTO技術棧 ? 2299瀏覽 ? 0回復
超GPT-4o，1240億參數！最強開源多模態模型 Pixtral Large！

Aceryt ? 2586瀏覽 ? 0回復
Qwen2-VL (2B、7B、72B)：迄今為止最好的開源視覺模型！！（擊敗 Claude 和 GPT-4o）

老蛀蟲 ? 4920瀏覽 ? 0回復
微軟發布Phi-4，最強小模型！參數極小、超GPT-4o

Aceryt ? 2320瀏覽 ? 0回復
微軟開源最強小模型Phi-4，超GPT-4o、可商用

Aceryt ? 2433瀏覽 ? 0回復
清華團隊靠強化學習讓 7B 模型打敗 GPT-4o 數學推理

Aceryt ? 2617瀏覽 ? 0回復
DeepSeek-R1-Distill-Qwen-1.5B 在某些基準測試中超越了 GPT-4o

Halo咯咯 ? 1.2w瀏覽 ? 0回復
清華發布GLM 4！32B參數模型硬剛GPT-4o，性能驚艷

Halo咯咯 ? 2730瀏覽 ? 0回復

duhorse

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言

代碼生成新SOTA

開發者們已經用上了

目錄