成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<center id="esysm"></center>

<code id="esysm"><delect id="esysm"></delect></code>

<center id="esysm"><acronym id="esysm"></acronym></center>

<li id="esysm"><tbody id="esysm"></tbody></li>

<center id="esysm"><acronym id="esysm"></acronym></center>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

流量工程將代碼生成的準(zhǔn)確率提高一倍：由19%提高至44%

作者：布加迪 2024-02-05 08:00:00

代碼生成是人工智能中一項(xiàng)越來(lái)越重要的能力。它指訓(xùn)練機(jī)器學(xué)習(xí)模型，基于對(duì)所需程序功能的自然語(yǔ)言描述自動(dòng)生成計(jì)算機(jī)代碼，并有許多潛在的應(yīng)用，從將軟件規(guī)格轉(zhuǎn)換成實(shí)用代碼、自動(dòng)化后端開(kāi)發(fā)到協(xié)助人類程序員，不一而足。

一篇新論文的作者提出了一種“強(qiáng)化”代碼生成的方法。

代碼生成是人工智能中一項(xiàng)越來(lái)越重要的能力。它指訓(xùn)練機(jī)器學(xué)習(xí)模型，基于對(duì)所需程序功能的自然語(yǔ)言描述自動(dòng)生成計(jì)算機(jī)代碼，并有許多潛在的應(yīng)用，從將軟件規(guī)格轉(zhuǎn)換成實(shí)用代碼、自動(dòng)化后端開(kāi)發(fā)到協(xié)助人類程序員，不一而足。

然而，與翻譯或總結(jié)等相關(guān)語(yǔ)言任務(wù)相比，生成高質(zhì)量代碼對(duì)AI系統(tǒng)依然具有挑戰(zhàn)性。代碼必須精確匹配目標(biāo)編程語(yǔ)言的語(yǔ)法，優(yōu)雅地處理極端情況和意外輸入，并準(zhǔn)確地處理問(wèn)題描述中指定的許多小細(xì)節(jié)。就連在其他領(lǐng)域無(wú)害的小錯(cuò)誤也可能完全破壞程序的功能，導(dǎo)致編譯或運(yùn)行失敗。

最近，CodiumAI的研究人員提出了一種名為AlphaCodium的新方法，可大幅提高GPT-4等大語(yǔ)言模型的代碼生成能力。他們的主要觀點(diǎn)是，僅僅調(diào)整提示的措辭對(duì)于復(fù)雜的編碼問(wèn)題具有固有的局限性。相反，他們?cè)O(shè)計(jì)了一個(gè)多階段流程，專注于對(duì)照測(cè)試用例迭代地生成、運(yùn)行和調(diào)試代碼，從而使模型能夠從經(jīng)驗(yàn)中學(xué)習(xí)。

提示工程的局限性

在自然語(yǔ)言任務(wù)中，提示工程指仔細(xì)調(diào)整提示的措辭和結(jié)構(gòu)，以指導(dǎo)模型生成所需的輸出。比如說(shuō)，在輸入文本之前添加短語(yǔ)“寫(xiě)簡(jiǎn)明的摘要：”可以從模型中得到針對(duì)性更強(qiáng)的摘要。

提示工程已被證明在做文本生成引導(dǎo)大語(yǔ)言模型行為方面非常有效。然而針對(duì)編碼問(wèn)題，研究人員發(fā)現(xiàn)，就連廣泛的及時(shí)調(diào)整也只能獲得極小的效益。原因發(fā)人深省。生成高質(zhì)量的代碼需要：

精確匹配目標(biāo)編程語(yǔ)言的語(yǔ)法
優(yōu)雅地處理極端情況和意外輸入
解決問(wèn)題陳述中描述的所有小細(xì)節(jié)和需求
為所有的有效輸入確保代碼正確編譯和運(yùn)行

這些結(jié)構(gòu)性需求遠(yuǎn)遠(yuǎn)超出了文本生成的范疇。將它們硬編碼到提示中對(duì)于復(fù)雜的問(wèn)題是行不通的。單單提示本身缺乏模型學(xué)習(xí)這些的編碼技巧和細(xì)微差別所需要的具體反饋。

AlphaCodium迭代流程

為了應(yīng)對(duì)這些挑戰(zhàn)，研究人員設(shè)計(jì)了一個(gè)針對(duì)代碼生成問(wèn)題結(jié)構(gòu)的迭代流程。關(guān)鍵的創(chuàng)新在于針對(duì)測(cè)試用例利用所生成代碼的執(zhí)行，以提供直接的學(xué)習(xí)信號(hào)。

AlphaCodium的流程有兩個(gè)主要階段：

預(yù)處理

模型將問(wèn)題描述釋義為項(xiàng)目符號(hào)，以提取關(guān)鍵細(xì)節(jié)。
解釋每個(gè)示例輸入/輸出背后的預(yù)期邏輯。
提供兩三個(gè)自然語(yǔ)言解決方案。
為代碼覆蓋生成額外的不同測(cè)試用例。

代碼迭代

模型生成初始代碼解決方案。
針對(duì)公共測(cè)試用例重復(fù)運(yùn)行該代碼，修復(fù)出現(xiàn)的錯(cuò)誤。
對(duì)模型生成的測(cè)試用例執(zhí)行同樣的事情。
額外的測(cè)試用例被添加到不斷增大的“測(cè)試錨”（test anchor）套件中，以防止回歸。

通過(guò)增量推理問(wèn)題、開(kāi)發(fā)解決方案假設(shè)、擴(kuò)展測(cè)試覆蓋，以及反復(fù)生成和調(diào)試代碼，模型通過(guò)經(jīng)驗(yàn)來(lái)學(xué)習(xí)——這正是高質(zhì)量代碼生成所需的技能。

圖1. 具有結(jié)構(gòu)化輸出的提示示例（生成可能的解決方案階段）

研究人員發(fā)現(xiàn)，與端到端模型相比，將流程設(shè)計(jì)為具有清晰接口和目標(biāo)的模塊可以獲得更好的結(jié)果。每個(gè)階段首先專注于更簡(jiǎn)單的子任務(wù)，以積累知識(shí)，并發(fā)掘?yàn)橄掠坞A段提供依據(jù)的洞察力。像測(cè)試生成這樣的上游階段不需要完整的解決方案，只需要基本的推理。

實(shí)驗(yàn)結(jié)果

研究人員依據(jù)CodeContests衡量基準(zhǔn)對(duì)AlphaCodium進(jìn)行了評(píng)估，該衡量基準(zhǔn)包含來(lái)自競(jìng)爭(zhēng)性編程比賽的數(shù)百個(gè)編碼問(wèn)題。

圖2. 問(wèn)題描述和反思——一個(gè)典型的CodeContests問(wèn)題的例子，基于人工智能對(duì)問(wèn)題進(jìn)行自我反思。雖然最初的描述冗長(zhǎng)而復(fù)雜，但適當(dāng)?shù)淖晕曳此伎梢允箚?wèn)題更清晰、更連貫，從而改進(jìn)代碼解決方案

針對(duì)GPT-4模型，與經(jīng)過(guò)大量?jī)?yōu)化的單個(gè)提示相比，AlphaCodium將驗(yàn)證集上的代碼生成準(zhǔn)確率從19%提高到了44%。面對(duì)不同的模型大小和測(cè)試集，這個(gè)好處依然適用，與單獨(dú)的提示工程相比收效顯著。

AlphaCodium的性能也顯著優(yōu)于之前發(fā)布的方法，比如AlphaCode和CodeChain，同時(shí)使用更少的計(jì)算資源。比如說(shuō)，它通過(guò)避免不必要的蠻力生成，其準(zhǔn)確性可以媲美AlphaCode，而模型查詢少10000倍。

這些結(jié)果證明了圍繞任務(wù)結(jié)構(gòu)整體設(shè)計(jì)AI系統(tǒng)的價(jià)值，而不是將其視為通用文本生成器。通過(guò)合并迭代代碼運(yùn)行和調(diào)試，AlphaCodium更好地將訓(xùn)練過(guò)程與生成健壯實(shí)用代碼的最終目標(biāo)結(jié)合起來(lái)。

更廣泛的影響

雖然針對(duì)競(jìng)爭(zhēng)性編程問(wèn)題進(jìn)行了演示，但AlphaCodium中使用的概念為AI推進(jìn)代碼生成提供了更廣泛的適用經(jīng)驗(yàn)：

單單提示工程對(duì)于處理復(fù)雜的代碼任務(wù)具有局限性。具體解決問(wèn)題的經(jīng)驗(yàn)至關(guān)重要。
基于測(cè)試的開(kāi)發(fā)規(guī)范可以為模型訓(xùn)練提供依據(jù)。測(cè)試提供了明確的適應(yīng)度函數(shù)。
迭代代碼調(diào)試將模型改進(jìn)的重點(diǎn)放在實(shí)際發(fā)生的錯(cuò)誤上。
測(cè)試覆蓋擴(kuò)展突出了提示中不可見(jiàn)的泛化性差距。
具有雙重驗(yàn)證的軟決策減少了脆弱性和偏差。

AlphaCodium為基于軟件工程最佳實(shí)踐的代碼生成提供了一種大有前途的新范式。關(guān)于泛化性和計(jì)算開(kāi)銷仍然存在有待商榷的研究問(wèn)題。但這里展示的原則（從經(jīng)驗(yàn)中學(xué)習(xí)、測(cè)試驅(qū)動(dòng)開(kāi)發(fā)、模塊化推理和迭代式調(diào)試）似乎為提高AI的編碼能力提供了堅(jiān)實(shí)的基礎(chǔ)。

論文鏈接：https://arxiv.org/pdf/2401.08500.pdf

代碼庫(kù)：https://github.com/Codium-ai/AlphaCodium

原文標(biāo)題："Flow engineering" doubles code generation accuracy (19% vs 44%)，作者：Mike Young

鏈接：https://notes.aimodels.fyi/flow-engineering-intensifies-for-code-generation/

責(zé)任編輯：姜華來(lái)源： 51CTO

代碼生成人工智能自然語(yǔ)言

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：欧美中文字幕一区二区 | 日韩在线看片 | 国产在线观看一区二区三区 | 日日操日日干 | 久久www免费视频 | 国产精品久久久久久久毛片 | 在线一区 | h视频在线观看免费 | 啪啪毛片 | 天天草草草 | 中文一区 | 日韩成人中文字幕 | 国产精彩视频 | 久久亚洲国产 | 久久99精品视频 | 日韩国产欧美一区 | 黄网免费看 | 亚洲综合在 | 亚洲国产偷| 日韩精品在线观看免费 | 黑人精品 | 久久久久久成人 | 中文字幕1区2区3区亚洲国产成人精品女人久久久 | 久久伦理电影 | eeuss国产一区二区三区四区 | 一级做a爰片性色毛片视频停止 | 欧美日韩福利 | 国产小视频精品 | 日本三级电影在线看 | 国产精品久久久精品 | 秋霞在线一区 | aaa在线观看| 国产精品一区二区三区久久久 | 国产三级精品三级在线观看四季网 | 999国产视频 | 日韩精品在线免费观看视频 | 免费亚洲视频 | 午夜影院在线观看版 | 亚洲成人av在线播放 | 一区二区三区在线观看视频 | 国产精品黄视频 |

<button id="eaqsa"></button>