成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

軟件包幻覺:LLM可能會(huì)向粗心的開發(fā)人員提供惡意代碼

人工智能
如今,許多軟件開發(fā)人員使用大型語言模型(LLM)來輔助編程,然而,不幸的是,LLM在回答各種話題的問題時(shí),會(huì)編造事實(shí)并自信地呈現(xiàn)出來,這一已知傾向也延伸到了編碼領(lǐng)域。

大型語言模型傾向于“虛構(gòu)”不存在的代碼包,這可能會(huì)成為一種新型供應(yīng)鏈攻擊的基礎(chǔ),這種攻擊被賽斯·拉森(Seth Larson,Python軟件基金會(huì)的駐場安全開發(fā)人員)稱為“slopsquatting”。

一種已知現(xiàn)象

如今,許多軟件開發(fā)人員使用大型語言模型(LLM)來輔助編程,然而,不幸的是,LLM在回答各種話題的問題時(shí),會(huì)編造事實(shí)并自信地呈現(xiàn)出來,這一已知傾向也延伸到了編碼領(lǐng)域。這種情況已為人所知一段時(shí)間了。一些研究人員之前已經(jīng)注意到,LLM偶爾會(huì)推薦不存在的軟件庫和包,并認(rèn)為這種傾向可能會(huì)被攻擊者利用,以這些名稱創(chuàng)建惡意包,并在PyPI(適用于Python)和npm(適用于JavaScript)等流行的代碼存儲(chǔ)庫中提供下載。

“這些包的虛構(gòu),是在使用LLM生成代碼時(shí)出現(xiàn)事實(shí)沖突錯(cuò)誤而產(chǎn)生的,代表了一種新型的包混淆攻擊,對軟件供應(yīng)鏈的完整性構(gòu)成了嚴(yán)重威脅,”來自德克薩斯大學(xué)圣安東尼奧分校、俄克拉荷馬大學(xué)和弗吉尼亞理工學(xué)院的一組研究人員指出。

潛在的惡作劇

該團(tuán)隊(duì)決定檢查包虛構(gòu)問題的嚴(yán)重程度,為此,他們測試了16個(gè)代碼生成AI模型(GPT-4、Claude、CodeLlama、DeepSeek Coder、Mistral等),使用了兩個(gè)獨(dú)特的提示數(shù)據(jù)集。LLM提供了576000個(gè)Python和JavaScript代碼樣本,其中推薦的包中,近20%是不存在的。為了確定LLM是否會(huì)反復(fù)虛構(gòu)相同的包,研究人員使用了一個(gè)包含500個(gè)生成包虛構(gòu)提示的隨機(jī)樣本,并對每個(gè)提示重復(fù)了10次查詢。

結(jié)果如何?“當(dāng)用同一個(gè)生成了虛構(gòu)的包的提示反復(fù)查詢模型時(shí):43%的虛構(gòu)包在所有10次查詢中都被重復(fù),而39%的虛構(gòu)包在10次查詢中根本沒有重復(fù)?!薄按送猓?8%的情況下,一個(gè)虛構(gòu)的包在10次迭代中會(huì)被重復(fù)一次以上,這表明大多數(shù)虛構(gòu)并非僅僅是隨機(jī)錯(cuò)誤,而是一種在多次迭代中持續(xù)存在的可重復(fù)現(xiàn)象,”他們指出。“這一點(diǎn)很重要,因?yàn)槌掷m(xù)的虛構(gòu)對試圖利用這一漏洞的惡意行為者來說更有價(jià)值,并使虛構(gòu)攻擊向量成為一個(gè)更可行的威脅?!?/p>

雖然大多數(shù)模型在許多情況下能夠檢測到自己的虛構(gòu),但問題在于,有許多開發(fā)人員使用AI模型來輔助組裝程序,并信任其提供的代碼。

“比如說,我讓ChatGPT幫我寫一些代碼,它寫了?,F(xiàn)在,假設(shè)在生成的代碼中它包含了一個(gè)包的鏈接,我信任它并運(yùn)行了代碼,但這個(gè)包不存在,它是一個(gè)虛構(gòu)的包。一個(gè)敏銳的對手/黑客可能會(huì)看到LLM的這種行為(LLM告訴人們使用這個(gè)不存在的包,這個(gè)虛構(gòu)的包),并意識到這一點(diǎn)。然后,對手就可以簡單地用與LLM推薦的虛構(gòu)包(名稱相同)創(chuàng)建一個(gè)新包,并在其中注入一些惡意代碼,”德克薩斯大學(xué)圣安東尼奧分校計(jì)算機(jī)科學(xué)系的副教授穆爾圖扎·賈德瓦拉(Murtuza Jadliwala)博士說。“現(xiàn)在,當(dāng)下一次LLM在生成的代碼中推薦相同的包時(shí),一個(gè)毫無戒心的用戶執(zhí)行了代碼,這個(gè)惡意包就會(huì)被下載并在用戶的機(jī)器上執(zhí)行?!?/p>

最小化包虛構(gòu)

研究人員認(rèn)為,也許許多虛構(gòu)的包在之前存在過,被包含在模型的預(yù)訓(xùn)練數(shù)據(jù)中,并在此期間被刪除了,于是他們對此進(jìn)行了調(diào)查,并發(fā)現(xiàn)已刪除的包是他們觀察到的包虛構(gòu)現(xiàn)象的“可忽略的來源”。他們還發(fā)現(xiàn),跨語言虛構(gòu)(例如,當(dāng)一種編程語言中的一個(gè)虛構(gòu)的包具有另一種編程語言中現(xiàn)有包的名稱時(shí))在搜索JavaScript包時(shí)更容易發(fā)生。最后,雖然大多數(shù)虛構(gòu)的包的名字與現(xiàn)有包的名字“有實(shí)質(zhì)性差異”,但這些名字通常很有說服力,并且符合上下文。

研究人員已提出了一些建議,以幫助LLM創(chuàng)建者在代碼生成過程中減少包虛構(gòu),但對于利用LLM的個(gè)人編碼人員來說,一般建議是,在包含提供的代碼之前,先檢查推薦的包。

責(zé)任編輯:姜華 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2023-10-13 12:04:33

惡意軟件加密

2011-04-30 16:56:45

Windows PhoiOS

2020-12-02 09:59:49

惡意軟件Docker開發(fā)

2017-07-27 14:20:36

開發(fā)應(yīng)用程序代碼

2023-02-14 07:19:31

2020-06-22 10:30:33

開發(fā)者工具代碼

2022-08-22 07:08:12

敏捷開發(fā)軟件

2017-12-07 20:20:03

2010-10-28 09:09:26

Windows Pho

2022-03-31 09:53:58

攻擊惡意包npm包

2021-09-07 12:20:49

惡意軟件TricBot網(wǎng)絡(luò)犯罪

2022-07-12 18:36:52

軟件開發(fā)企業(yè)開發(fā)人員

2014-04-30 15:44:11

2012-07-20 10:46:44

Web

2013-09-10 09:17:34

Windows 8.1

2021-07-08 09:57:47

Java 11Java 8開發(fā)人員

2009-05-28 09:18:15

AndroidGoogle移動(dòng)OS

2021-07-16 17:05:56

Java 8語言Java 11

2021-12-26 07:54:03

供應(yīng)鏈攻擊網(wǎng)絡(luò)罪犯網(wǎng)絡(luò)攻擊

2012-02-06 15:39:05

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 台湾a级理论片在线观看 | 国产精品久久久久久久久久久免费看 | 国产精品久久久久久久久久久免费看 | 欧美亚洲视频在线观看 | 亚洲一区二区三区四区五区中文 | 亚洲一区二区久久 | 国产精品揄拍一区二区 | 欧美精品久久 | 久久久精品一区二区三区 | 国产一区二区三区 | www.男人天堂.com | 国产一区二区三区在线 | 婷婷久久网 | 在线播放91| 国产精品久久久99 | 精品国产一区二区三区成人影院 | 国产一级黄色网 | 免费久草 | 超碰最新在线 | 亚洲激情在线观看 | 91av精品| 天天天操操操 | 国产在线a| 婷婷五月色综合香五月 | 九九热九九 | 91精品国产91久久久久久最新 | 成人一区二区三区 | 国产午夜精品一区二区三区在线观看 | 一区二区三区小视频 | 精品久久久久久久久久久下田 | 久久精品一区二 | 欧美激情亚洲 | 国产一区 | 91资源在线 | 欧美一区二区大片 | 日本久久精品视频 | 亚洲精品视频在线观看免费 | 日本在线观看网址 | 国产欧美一区二区三区另类精品 | 99久久精品免费看国产小宝寻花 | 成人欧美一区二区三区黑人孕妇 |