成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kimi新模型拿下代碼開源SOTA,僅僅72B,發布即開源

人工智能 新聞
開源代碼模型Kimi-Dev,在SWE-bench Verified上以60.4%的成績取得開源SOTA。

深夜,沉寂已久的Kimi突然發布了新模型——

開源代碼模型Kimi-Dev,在SWE-bench Verified上以60.4%的成績取得開源SOTA。

參數量只有72B,但編程水平比最新的DeepSeek-R1還強,和閉源模型比較也表現優異。

圖片

有網友看到后表示,感覺月之暗面的實力被低估了,其水平應該比xAI強。

圖片

Kimi-Dev采用MIT協議,目前權重和代碼均已發布,還有網友制作的量化版本也已在抱抱臉上線。

那么,Kimi-Dev是如何做到的呢?

模型扮演兩種角色,在測試中自我博弈

目前,Kimi-Dev的完整技術報告暫未出爐,不過官方透露了其中的一些關鍵技術。

Kimi-Dev-72B的設計核心是BugFixer和TestWriter兩種角色的結合,BugFixer和TestWriter都遵循一個共同的最小框架,包含兩個階段:

  • 文件定位(File Localization):首先找到需要修改的正確文件;
  • 代碼編輯(Code Edits):修正現有代碼中的問題或潛在缺陷(BugFixer),以及編寫并添加新的單元測試代碼(estWriter)。

圖片

為了增強Kimi-Dev-72B作為BugFixer和TestWriter的先驗知識,Kimi團隊以Qwen 2.5-72B基礎模型為起點使用約1500億高質量真實數據進行中期訓練。

具體來說,Kimi團隊收集了數百萬個GitHub issue和PR提交,目的是讓Kimi-Dev-72B能夠學習人類開發人員如何推理并解決GitHub問題。

另外,Kimi團隊還進行了嚴格的數據凈化,確保訓練數據當中不包含SWE-bench Verified里的內容。

經過中期訓練和監督微調(SFT)后,Kimi-Dev-72B在文件定位方面已經表現出色,之后的強化學習階段主要側重于提升其代碼編輯能力。

強化學習訓練采用了Kimi k1.5中的策略優化方法,主要有三個關鍵設計:

一是僅基于結果的獎勵(Outcome-based Reward Only)——訓練中僅使用代碼在Docker環境中的最終執行結果(成功為 1,失敗為 0)作為獎勵,而不考慮任何與代碼格式或編寫過程的因素。

這確保了模型生成的解決方案的正確性以及與實際開發標準的一致性。

二是采用了高效提示集(Efficient Prompt Set),過濾掉在多樣本評估下成功率為零的提示,以更有效地進行大批量訓練。

此外,強化學習階段還采取了循序漸進的策略,逐步引入新提示,逐步增加任務難度。

三是正向示例強化(Positive Example Reinforcement),也就是在后面的訓練過程中,Kimi-Dev會將它之前已經解決的問題的方案重新納入當前的訓練批次中進行學習,從而鞏固和強化之前有效的、成功的解決模式和方法。

圖片

經過強化學習后,Kimi-Dev-72B能夠同時掌握兩種角色。在測試過程中,它會采用自我博弈機制,協調自身Bug修復和測試編寫的能力。

Kimi-Dev-72B會遵循標準Agentless設置,為每個問題生成最多40個補丁候選(patch candidates)和40個測試候選(test candidates)。

在測試時間自我博弈中,觀察到了規模效應(scaling effect)。

圖片

以上就是Kimi團隊介紹的Kimi-Dev背后的關鍵,更多細節將在后續的技術報告中揭曉,感興趣的話可以關注Kimi團隊的發布。

下一步,Kimi團隊還計劃探索更復雜的軟件工程任務,并將于與流行的IDE、版本控制系統和CI/CD流水線進行更深入的集成。

項目主頁:
https://moonshotai.github.io/Kimi-Dev/
GitHub:
https://github.com/MoonshotAI/Kimi-Dev
HuggingFace:
https://huggingface.co/moonshotai/Kimi-Dev-72B

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-17 17:14:01

DeepSeekSOTA開源

2025-04-14 00:30:00

2024-04-02 09:17:50

AI數據開源

2025-04-27 08:30:00

2025-03-13 12:39:22

2024-06-04 14:09:00

2024-08-19 08:45:00

開源模型

2024-09-19 14:00:00

模型開源代碼

2025-01-03 15:39:02

2024-11-12 14:00:00

AI編程

2025-05-12 09:00:00

2025-07-02 14:39:29

開源模型AI

2023-05-17 10:05:56

2024-12-03 15:51:45

2025-04-07 08:50:00

模型AI數據

2025-03-25 12:11:08

2025-03-04 09:00:00

2024-06-19 13:02:01

2023-10-04 10:55:42

機器狗AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费成人国产 | 麻豆av在线免费观看 | 国产福利网站 | 久久综合一区二区三区 | 国产美女在线精品免费 | 国产一级片久久久 | 欧美 日韩 国产 成人 在线 91 | 性福视频在线观看 | 国产精品久久国产精品 | 日韩电影一区 | 国产不卡视频 | 亚洲国产成人av好男人在线观看 | 日韩视频在线观看一区二区 | 久久视频一区 | 日韩在线三级 | 国产精品国产成人国产三级 | 日韩在线视频一区 | 毛片一级网站 | 爱爱视频日本 | 四虎最新视频 | 国内自拍第一页 | 成人av观看 | 久久久这里只有17精品 | 精品亚洲一区二区三区四区五区 | 久久99精品久久久久久 | 伊人网站 | 午夜理伦三级理论三级在线观看 | 国产精品久久久久aaaa九色 | 精品福利一区二区三区 | 又黄又色 | 久久三区 | 亚洲视频国产视频 | 天天舔天天 | 亚洲综合99 | 免费成人高清 | 国产福利小视频 | 天天操天天干天天透 | 国产人久久人人人人爽 | 孕妇一级毛片 | 国产精品久久久久国产a级 欧美日本韩国一区二区 | 欧美高清dvd|