成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

上下文1.6萬(wàn)token的編程大模型來(lái)了!與Stable Diffusion出自同門,一次吃5個(gè)Python文件不費(fèi)勁

開發(fā) 架構(gòu)
我們非常喜歡BigCode,因?yàn)樗麄冊(cè)跀?shù)據(jù)治理、模型治理和模型訓(xùn)練方面做了驚人的工作,我們用了他們的數(shù)據(jù)集,并對(duì)其進(jìn)行了額外的過(guò)濾和清理,同時(shí)也用在了構(gòu)建長(zhǎng)上下文窗口的模型,在我們的集群上進(jìn)行了訓(xùn)練。

一個(gè)Stable Diffusion還不夠!Stability AI再放殺手锏,進(jìn)擊代碼生成領(lǐng)域:

推出了一款自稱具有革命性的編碼工具StableCode。

敲重點(diǎn)的是,StableCode不僅支持Python、Go、Java、JavaScript、C、Markdown、C++等多種編程語(yǔ)言。

還直接把上下文長(zhǎng)度拉到16000個(gè)token。

圖片圖片

好家伙,網(wǎng)友直呼瘋批:

圖片圖片

這波還直接戳中網(wǎng)友痛點(diǎn):

我們真的很需要一個(gè)能夠?qū)⒄麄€(gè)代碼庫(kù)塞進(jìn)上下文的工具。

圖片圖片

上下文窗口16000token

官網(wǎng)顯示,StableCode模型具有30億參數(shù),將提供基礎(chǔ)模型、指令模型、長(zhǎng)上下文窗口模型三種不同的模型,幫助開發(fā)人員編碼。

圖片圖片

StableCode在HPC(高性能計(jì)算)集群上,使用5600億代碼token的編程語(yǔ)言數(shù)據(jù)集starcoder-data對(duì)基礎(chǔ)模型進(jìn)行了訓(xùn)練。

StarCoder是HuggingFace和ServiceNow合作成立的開放科學(xué)合作組織BigCode于五月份開源的針對(duì)代碼的大模型。

Stability AI首席研究科學(xué)家Nathan Cooper對(duì)VentureBeat表示:

我們非常喜歡BigCode,因?yàn)樗麄冊(cè)跀?shù)據(jù)治理、模型治理和模型訓(xùn)練方面做了驚人的工作,我們用了他們的數(shù)據(jù)集,并對(duì)其進(jìn)行了額外的過(guò)濾和清理,同時(shí)也用在了構(gòu)建長(zhǎng)上下文窗口的模型,在我們的集群上進(jìn)行了訓(xùn)練。

對(duì)于復(fù)雜的編程任務(wù),StableCode則針對(duì)特定用例進(jìn)行了指令調(diào)優(yōu)。

在基礎(chǔ)模型的基礎(chǔ)上,用約120000個(gè)Alpaca格式的“代碼指令-回答”對(duì)訓(xùn)練了指令模型。

圖片圖片

△StableCode指令生成對(duì)給定指令響應(yīng)的代碼。

此外,為了滿足用戶對(duì)上下文窗口長(zhǎng)度的需求,StableCode的長(zhǎng)上下文窗口模型直接將上下文窗口拉長(zhǎng)至16000個(gè)token,是此前開源模型的2-4倍。

△與類似大小的模型(3B)進(jìn)行的 HumanEval 基準(zhǔn)比較。△與類似大小的模型(3B)進(jìn)行的 HumanEval 基準(zhǔn)比較。

不僅為用戶提供了可單行、多行自動(dòng)完成建議的工具,還允許用戶同時(shí)查看編輯相當(dāng)于五個(gè)中等大小的Python文件,允許更專業(yè)復(fù)雜的代碼生成prompt。

下面是一個(gè)StableCode利用Pytorch深度學(xué)習(xí)庫(kù)完成一個(gè)相對(duì)復(fù)雜的Python文件展示(灰色文本顯示了StableCode的預(yù)測(cè))。

圖片圖片

使用了RoPE的方法

此外,StableCode也是用到了Transformer架構(gòu),不同于StarCoder用ALiBi(線性偏差的注意力)的方法定位模型輸出,StableCode則是使用了RoPE(旋轉(zhuǎn)位置嵌入)的方法。

Cooper表示:

在Transformer模型中,ALiBi方法傾向于更加重視當(dāng)前的token,而不是過(guò)去的token。這對(duì)于代碼生成來(lái)說(shuō)不是一個(gè)理想的方法,因?yàn)榇a沒(méi)有固定的敘述結(jié)構(gòu),沒(méi)有明確的開始、中間和結(jié)束。代碼的功能可以在應(yīng)用流程的任何點(diǎn)被定義。所以我們使用RoPE,它沒(méi)有這種偏見。

StableCode目前還處于早期階段,初始發(fā)布的目標(biāo)是觀察開發(fā)者如何接受和使用這個(gè)模型。

我們將與社區(qū)進(jìn)行互動(dòng)合作,看看他們會(huì)提出哪些有趣的方向,并針對(duì)開發(fā)者領(lǐng)域進(jìn)行生成式探索 。

研究主管Christian Laforte也淺聊了StableCode的目標(biāo):

與Stable Diffusion幫助世界上任何人成為藝術(shù)家類似,我們希望StableCode模型能讓任何有好點(diǎn)子但卻遇到問(wèn)題的人,能夠編寫一個(gè)解決問(wèn)題的程序。

看到Stability AI再放大招的這波操作,有網(wǎng)友在去測(cè)試Github Copilot的路上來(lái)了個(gè)掉頭:

圖片圖片

還有網(wǎng)友希望“預(yù)定”下一次動(dòng)作:

真的很想看Stability AI在文本轉(zhuǎn)語(yǔ)音方面,做些類似谷歌SoundStorm(聲音風(fēng)暴)的事啊。

圖片圖片

此外,StableCode目前已經(jīng)開源啦!

參考鏈接:
[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
[2]https://twitter.com/StabilityAI/status/1688931312122675200

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2023-08-10 14:04:15

代碼模型

2024-03-14 08:11:45

模型RoPELlama

2023-07-11 10:02:23

2017-05-11 14:00:02

Flask請(qǐng)求上下文應(yīng)用上下文

2025-03-18 09:10:00

MCPAI模型上下文協(xié)議

2025-03-18 08:14:05

2025-01-08 11:10:46

2021-07-26 07:47:36

Cpu上下文進(jìn)程

2025-02-26 00:16:56

RAGAI服務(wù)

2025-03-26 03:00:00

MCPAI應(yīng)用

2023-08-25 13:27:00

模型開源

2012-12-31 10:01:34

SELinuxSELinux安全

2024-03-29 14:04:00

模型訓(xùn)練

2022-09-14 13:13:51

JavaScript上下文

2025-06-06 08:00:00

上下文管理器Python開發(fā)

2025-05-20 02:11:00

2023-11-22 11:22:57

AI模型

2025-02-06 10:21:51

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 情侣酒店偷拍一区二区在线播放 | 中文字幕亚洲一区二区三区 | 毛片免费观看视频 | 国产亚洲精品精品国产亚洲综合 | 欧美一级电影免费观看 | 日韩一二区 | 亚洲国产aⅴ成人精品无吗 欧美激情欧美激情在线五月 | 国产精品精品视频一区二区三区 | 一区中文字幕 | 亚洲视频在线看 | 一区二区影视 | 日韩一区二区视频 | 国产精品久久久久久久久久 | 日韩欧美国产综合 | 亚洲精品久久久久久宅男 | 九九热在线精品视频 | 亚洲国产精品va在线看黑人 | 一区中文字幕 | av三级| 激情欧美一区二区三区 | 欧美色综合一区二区三区 | 欧美精品一区二区三区在线播放 | 亚洲男人天堂 | 久久国产区 | 久久久久久亚洲欧洲 | www.日日夜夜 | 久久精品国产久精国产 | 国产精品久久久久久久免费大片 | 精品综合| 天堂中文资源在线 | 黑人中文字幕一区二区三区 | 成人无遮挡毛片免费看 | 亚洲精品电影网在线观看 | 久久综合av| 在线观看av网站永久 | 亚洲免费一区 | a级免费黄色片 | 毛片一区二区三区 | 免费99精品国产自在在线 | 欧美一级做性受免费大片免费 | 欧美大片一区二区 |