成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型“自動修 bug”能力將提升,豆包團隊開源首個多語言代碼修復基準 Multi-SWE-bench

人工智能 開源
4 月 10 日消息,豆包大模型團隊今日通過官方公眾號宣布,首個多語言類 SWE 數據集 Multi-SWE-bench 現已正式開源,可用于評估和提升大模型“自動修 Bug”能力。

4 月 10 日消息,豆包大模型團隊今日通過官方公眾號宣布,首個多語言類 SWE 數據集 Multi-SWE-bench 現已正式開源,可用于評估和提升大模型“自動修 Bug”能力。

在 SWE-bench 基礎上,Multi-SWE-bench 首次覆蓋 Python 之外的 7 種主流編程語言,是真正面向“全棧工程”的評測基準。其數據均來自 GitHub issue,歷時近一年構建,以盡可能準確測評和提高大模型高階編程智能水平。

Multi-SWE-bench 旨在推動自動編程技術從僅能解決單一語言(如 Python)和低復雜度的任務,朝著支持多語言、具備真實問題解決能力的通用型智能體邁進。

SWE-bench 是當前最具代表性的代碼修復評測基準,強調任務真實、難度高。它基于 GitHub issue,要求模型自動定位并修復 Bug,兼具跨文件修改、復雜語義推理與上下文理解等挑戰。

Multi-SWE-bench 旨在補全現有同類基準語言覆蓋方面的不足,系統性評估大模型在復雜開發環境下的“多語言泛化能力”,推動多語言軟件開發 Agent 的評估與研究,其主要特性如下:

  • 首次覆蓋 7 種主流編程語言(包括 Java、Go、Rust、C、C++、TypeScript、JavaScript),構建多語言開發環境下的代碼修復任務,系統評估模型的跨語言適應與泛化能力;
  • 引入任務難度分級機制,將問題劃分為簡單(Easy)、中等(Medium)和困難(Hard)三類,涵蓋從一行修改到多文件、多步驟、多語義依賴的開發挑戰;
  • 1,632 個實例全部來源于真實開源倉庫,并經過統一的測試標準和專業開發者的審核篩選,確保每個樣本具備清晰的問題描述、正確的修復補丁以及可復現的運行測試環境。

IT之家附開源鏈接:

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving:

責任編輯:龐桂玉 來源: IT之家
相關推薦

2024-09-29 13:10:08

2024-11-02 10:28:03

2024-07-15 07:52:00

2023-07-05 09:57:11

2024-12-05 15:22:19

2024-11-01 20:25:28

2024-12-05 12:26:28

2021-06-29 21:48:32

開源語言架構

2024-03-19 13:12:36

自動駕駛模型

2025-02-17 14:43:51

2024-03-04 14:15:16

OpenAI語言嵌入模型

2024-11-25 15:30:00

語言模型數據

2025-03-05 08:40:00

2014-04-16 14:50:20

Spark

2024-02-23 11:27:00

數據技術

2019-12-05 16:00:15

Vim插件編程文本編輯器

2011-08-05 17:54:33

Cocoa Touch 多語言

2014-07-09 09:20:06

WPFWPF應用
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 九九久久久| 国产在线二区 | 国产日韩免费视频 | 免费观看黄网站 | 精品国产一区二区三区久久狼黑人 | 伊人电影院av | 久久天堂 | 黄色片免费看 | 国产小u女发育末成年 | 超碰av在线 | 一本色道精品久久一区二区三区 | 欧美成人激情 | 久久性av | 成人免费在线视频 | www久久久 | 999热精品视频 | 欧美一区二区三区高清视频 | 久久中文字幕一区 | 亚洲欧美日韩一区 | 亚洲情综合五月天 | 成人毛片视频免费 | 日韩欧美三级电影在线观看 | 久久亚洲国产精品日日av夜夜 | 欧美国产一区二区 | 97在线观视频免费观看 | 天天亚洲 | 性色av一区二区三区 | av二区三区 | 国产我和子的乱视频网站 | 久久伊人一区二区 | 精品亚洲视频在线 | 国产精品自拍一区 | 亚洲成色777777在线观看影院 | 日本一二区视频 | 成人福利网站 | 欧美video| 欧美激情99 | 久久免费国产视频 | 国产大片一区 | 91成人午夜性a一级毛片 | 国产资源视频 |