成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開源 AI 代碼生成器 PolyCoder:擅長(zhǎng) C 語言,優(yōu)于 Codex

開發(fā)
卡內(nèi)基梅隆大學(xué)的研究人員推出了一個(gè)開源的自動(dòng)代碼生成器模型 PolyCoder,具有 27B 參數(shù),基于 GPT-2 架構(gòu),在一臺(tái)機(jī)器上對(duì)跨越 12 種編程語言的 249GB 代碼進(jìn)行了訓(xùn)練。

卡內(nèi)基梅隆大學(xué)的研究人員推出了一個(gè)開源的自動(dòng)代碼生成器模型 PolyCoder,具有 27B 參數(shù),基于 GPT-2 架構(gòu),在一臺(tái)機(jī)器上對(duì)跨越 12 種編程語言的 249GB 代碼進(jìn)行了訓(xùn)練。訓(xùn)練結(jié)果表明,在 C 編程語言中,PolyCoder 優(yōu)于包括 Codex 在內(nèi)的所有模型。

  • “最近,代碼的大型語言模型(LM)在完成代碼和從自然語言描述中合成代碼方面顯示出巨大的前景。然而,目前最先進(jìn)的代碼 LM(如 Codex)并沒有公開提供,留下許多關(guān)于他們的模型和數(shù)據(jù)設(shè)計(jì)決策的疑問。我們的目標(biāo)是通過對(duì)各種編程語言中最大的現(xiàn)有模型的系統(tǒng)評(píng)估來填補(bǔ)其中的一些空白:Codex、GPT-J、GPT-Neo、GPT-NeoX20B 和 CodeParrot。盡管 Codex 本身不是開源的,但我們發(fā)現(xiàn)現(xiàn)有的開源模型在一些編程語言中確實(shí)取得了接近的結(jié)果,雖然主要針對(duì)的是自然語言建模。我們進(jìn)一步確定了一個(gè)重要的缺失部分,即專門在多語言的代碼語料庫中訓(xùn)練的大型開源模型。”

研究人員指出,OpenAI 的 Codex 于去年 8 月發(fā)布,可通過微軟擁有的 GitHub 的 Copilot 工具獲得;但它通過黑盒 API 調(diào)用提供對(duì)模型輸出的“non-free access”,模型的權(quán)重和訓(xùn)練數(shù)據(jù)并不可用。DeepMind 聲稱其最近發(fā)布的 AlphaCode 代碼生成器在人類參與的編程比賽中排名前 54.3%,但是訓(xùn)練這個(gè)模型需卻要在谷歌的數(shù)據(jù)中心進(jìn)行"hundreds of petaFLOPS days"的訓(xùn)練。

“盡管大型語言代碼模型取得了巨大成功,但最強(qiáng)的模型都尚未公開。這阻止了這些模型在資源充足的公司之外的應(yīng)用,并限制了資源匱乏的組織在這一領(lǐng)域的研究。”

為了解決這一問題,他們推出了 PolyCoder。該模型使用來自 GitHub 的多個(gè)存儲(chǔ)庫的數(shù)據(jù)進(jìn)行訓(xùn)練,涵蓋 12 種流行的編程語言:C、C#、C++、Go、Java、JavaScript、PHP、Python、Ruby、Rust、Scala 和 TypeScript。未經(jīng)過濾的數(shù)據(jù)集總共有 631GB 的數(shù)據(jù)和 3890 萬個(gè)文件。此外,為了訓(xùn)練 PolyCoder,研究人員選擇了 GPT-2(因?yàn)轭A(yù)算有限)。

不過雖然 PolyCoder 在 C 語言方面的表現(xiàn)優(yōu)于所有模型,但 Codex 在其他語言方面仍然要?jiǎng)龠^ PolyCoder。

“值得注意的是,PolyCoder 在 C 語言方面優(yōu)于 Codex 和所有其他模型。在比較單獨(dú)的開源模型時(shí),PolyCoder 在 C、JavaScript、Rust、Scala 和 TypeScript 方面的表現(xiàn)比類似規(guī)模的 GPT-Neo 2.7B 更好。在除 C 語言以外的其他 11 種語言中,所有其他開源模型,包括我們的,都明顯比 Codex 差(higher perplexity)。”

??詳情可查看??

本文轉(zhuǎn)自O(shè)SCHINA

本文標(biāo)題:開源 AI 代碼生成器 PolyCoder:擅長(zhǎng) C 語言,優(yōu)于 Codex

本文地址:https://www.oschina.net/news/185793/open-source-ai-code-generator-polycoder

責(zé)任編輯:未麗燕 來源: OSCHINA
相關(guān)推薦

2022-03-14 17:38:20

AI模型開源

2021-07-23 11:24:54

Create Inc開源G代碼生成器

2009-07-03 09:29:24

KeelKit

2022-03-09 07:29:55

AI開源C語言

2024-08-19 00:00:00

表單生成器開發(fā)開源

2023-05-04 16:24:10

人工智能圖像生成器

2015-08-25 15:54:17

程序員代碼生成器

2023-05-17 16:02:00

CSS工具代碼生成器

2025-01-08 08:00:20

2020-04-30 21:40:14

C#特性編程語言

2023-08-04 09:00:00

人工智能GPT-4語言模型

2023-01-06 07:52:52

代碼生成器開發(fā)

2023-03-06 10:29:37

人工智能威脅

2024-02-23 15:53:13

OpenAISora人工智能

2012-09-21 10:54:21

開源Linux防火墻

2024-06-12 13:40:58

2020-10-20 09:53:11

代碼IDEA生成器

2021-10-29 11:25:41

代碼編程語言Java

2012-03-30 09:31:44

WEBCSS

2021-12-10 09:45:19

生成器配置代碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩成人免费 | 国产精品美女久久久久久久网站 | 99久久精品一区二区成人 | 中文字幕在线国产 | 免费在线观看av网站 | 在线观看国产www | 国产精品美女久久久av超清 | 欧美精品乱码久久久久久按摩 | 可以免费看的毛片 | 久99久视频 | 日韩精品一区二区三区在线观看 | 一区二区三区视频免费看 | 91影院| 日日骚视频 | 精品国产乱码久久久久久丨区2区 | 可以在线观看av的网站 | 久久久久成人精品免费播放动漫 | 亚洲国产精选 | 美女福利视频一区 | 国产午夜精品久久久 | 欧美国产日韩在线 | 综合久久99| 国产成人精品午夜 | 日本一区高清 | 男女羞羞视频在线观看 | 日韩国产在线观看 | 国产精品99久久久久 | 国产一区二区成人 | 成人综合视频在线 | 欧美精品在欧美一区二区少妇 | 99亚洲精品 | 日韩在线免费播放 | 亚洲国产精品精华素 | 国产视频一区在线 | 精品国产乱码久久久 | 精品一区二区三区不卡 | 日韩在线小视频 | 日韩一区二区三区视频在线观看 | 国产1区| 成人做爰www免费看视频网站 | 日本不卡一区二区三区在线观看 |