成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT修bug橫掃全場,準確率達78%!網友:程序員要開心了

人工智能
ChatGPT準確修復了其中31個bug,遙遙領先第二名(21個),直接拿下“AI修bug界”的SOTA成績!

?ChatGPT到底有多會修bug?

這事終于有人正兒八經地搞研究了——

來自德國、英國的研究人員,專門搭了個“擂臺”來檢驗ChatGPT的這項本領。

圖片

除了ChatGPT之外,研究人員還找來了其它三位修bug的“AI猛將”,分別讓它們修復40個錯誤代碼。

結果真是不比不知道,一比嚇一跳。

ChatGPT準確修復了其中31個bug,遙遙領先第二名(21個),直接拿下“AI修bug界”的SOTA成績!

圖片

于是乎,這項研究引來了眾多網友的圍觀和討論,Reddit上發布此帖的標題更是用上了“小心”、“注意”這樣的字眼:

圖片

但事實上,這真的會讓程序員“危”嗎?

我們不妨先來看下這項研究。

很會修bug的ChatGPT

雖然ChatGPT并非是為了專門修改bug而生,但自打它問世以來,不少網友們都發現它是具備這項能力的。

因此研究人員為了摸清ChatGPT到底能修改bug到什么程度,便引入了標準的錯誤修復基準集QuixBugs來進行評估。

以及與它同臺競技的AI選手,分別是CodeX、CoCoNut和Standard APR。

研究人員從QuixBugs中挑了40個問題,分別讓它們來修復bug。

讓ChatGPT來修bug的方法,就是在對話框里向它提問:

這個代碼有什么錯誤嗎?

在第一輪較量過后,結果如下:

圖片

從第一輪battle結果來看,ChatGPT修復了19個,CodeX修復了21個,CoCoNut修復了19個,Standard APR則是7個。

而且研究人員還發現,ChatGPT的答案與CodeX最為相似;這是因為它倆是來自同一個語言模型家族。

這時候就會有小伙伴要問了,“ChatGPT不是還沒有CodeX厲害嗎”。

別急,不要忘了,ChatGPT的一個特點就是越問越“上道”。

例如在這個基準集中,有一個叫bitcount的問題,ChatGPT在剛才第一輪修復過程中是給了錯誤的答案:

圖片

原本ChatGPT應該將第7行的 n ^ = n - 1 改為 n & = n - 1。

但在第一輪中它的回答是:

如果沒有更多關于預期行為和導致問題的輸入信息,我無法判斷程序是否存在錯誤。

于是在給予它更多信息之后,ChatGPT便答對了這個問題。

以此類推,在對第一輪沒答對的問題進行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:

圖片

最終,ChatGPT在QuixBugs的40個問題里答對了31個。

網友憂喜參半

對于這樣的實驗結果,網友們對ChatGPT修bug拿下SOTA這事產生的態度卻不太一樣。

有網友認為這事不應該讓程序員感到危機,而是會讓他們覺得開心才對。

言外之意,便是程序員們有了這么好用的工具,干活兒就會變得事半功倍。

圖片

不過也有人對此給出了不一樣的看法:

工作變得簡單,不也就意味著需要的人力更少了嗎?

圖片

但還網友覺得,活兒是干不完的:

即使AI能把開發時間縮短一個數量級,也只是意味著程序員將更快處理下一個工作。

圖片

整體來看,ChatGPT很會修bug,并不會給程序員帶來什么致命傷害。

但若是把目光放到OpenAI其他的行動中呢?

全球招外包訓練ChatGPT寫代碼

在此之前,OpenAI就表示過ChatGPT的重要用途之一是幫助程序員檢查代碼。

換言之,它被定位可用的輔助工具。

相比“ChatGPT帶來威脅”的看法,等ChatGPT能力徹底進化,程序員都不用再怕寫bug了。

OpenAI布局的棋盤上,可不只有改bug偷塔程序員崗位這一件事。

為了讓它更大更強,OpenAI被曝在拉美和東歐等地區,提供了1000個外包崗位。

外包員工的主要工作是標注數據,以及訓練ChatGPT寫代碼

這1000人中,40%是程序員,他們為OpenAI的模型創建數據,用來學習軟件工程任務。

一直以來,OpenAI的訓練數據是從GitHub上抓取的。

現在外包程序員們新手搓的數據集,不僅包括代碼行,還包括代碼行背后的人類思考邏輯步驟。

有位南美的軟件開發人員爆料,他為OpenAI完成了五小時的無償編碼測試。

整個過程中,他的任務分為兩部分。

  • 用書面英語解釋如何處理一個編碼問題;
  • 提供解決方案。

如果發現bug,OpenAI會向他詳細詢問bug的具體情況,并請教如何修正。

程序員需要展示思考問題的每個步驟,他據此猜測OpenAI很可能想為ChatGPT提供非常具體的訓練數據。

特斯拉前AI主管Andrej Karpathy在推特上調侃:

最新的熱門編程語言是英語。

圖片

不過話說回來,ChatGPT修bug能力強是好事,要真能搞進化到可以完成代碼里死記硬背的部分,也是好事。

畢竟OpenAI成立時對外宣稱的宗旨,就是希望“確保通用人工智能可以造福全人類”。

雖然乍一看它這些年做的事,有點像在致力于用一部分人的努力,讓更多人失業。

從Dota2賽場上碾壓人類,到GPT-3、DALL-E2、ChatGPT的閃耀表現,它帶來的新產品總是伴隨著“快要讓xxx失業了”的議論聲。

但無論如何,商業卻一直對它青睞有加。

就目前而言,OpenAI的主要商業模式是API費用、token費用和軟件許可。

OpenAI近期還發布了ChatGPT的付費版ChatGPT Pro,每月費用42美元(約合285元人民幣)。

圖片

雖然機器人對話初創公司如雨后春筍般冒出,但諸多跡象表明市場對OpenAI的持續看好。

微軟剛剛宣布將向OpenAI加碼投資數十億美元,并將OpenAI的模型融入微軟必應等消費級和企業級產品中。

根據知情人士透露,此次追加投資數額約為100億美元。

與此同時,WSJ披露的消息顯示,1月初,億萬富翁Peter Thiel創立的風投基金Founders Fund正在就投資OpenAI進行談判。

據悉,融資金額將至少達3億美元。

One More Thing

在第一輪實驗中,ChatGPT并沒有解決QuixBugs數據集的bitcount問題。

但若是你現在再重頭問一次這個問題,就會發現ChatGPT可以“一遍過”:

圖片

那么這是否意味著ChatGPT已經從這次研究過程中學會求解了呢?

參考鏈接:

[1] ??https://arxiv.org/abs/2301.08653???
[2] ???https://www.pcmag.com/news/watch-out-software-engineers-chatgpt-is-now-finding-fixing-bugs-in-code???
[3] ???https://www.reddit.com/r/technology/comments/10oaw6n/watch_out_software_engineers_chatgpt_is_now/???
[4] ???https://en.wi.bwl.uni-mainz.de/dominik-sobania/??

責任編輯:武曉燕 來源: 量子位
相關推薦

2022-08-02 14:45:16

AI微軟工具

2022-12-08 20:16:43

2020-05-08 15:41:08

程序員技術設計

2022-12-07 10:02:17

ChatGPTAI免費試用

2018-11-14 10:01:30

谷歌開源機器學習

2018-10-25 22:34:34

機器人人工智能系統

2024-03-18 06:55:51

DevinAI程序員人工智能

2023-03-29 09:11:55

2023-11-08 08:38:43

2023-05-04 09:39:16

AI模型

2010-11-22 13:28:55

2023-11-21 21:47:31

2022-09-14 09:55:32

人工智能AI解碼技術

2020-11-20 17:03:11

AI 數據人工智能

2023-10-26 08:40:15

模型隱私推理

2024-01-05 08:44:52

2019-11-20 15:01:55

開源技術 趨勢

2023-05-14 17:21:04

2022-04-22 10:29:46

機器學習數據集計算

2024-11-11 10:00:00

ChatGPT模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久精品网站 | 午夜视频网 | 日韩精品久久一区 | 黄色香蕉视频在线观看 | 国产成人综合亚洲欧美94在线 | 成人免费观看男女羞羞视频 | 久久国产精品一区二区三区 | 综合激情久久 | av影音在线 | 精品一区二区三区在线视频 | 中文字幕av亚洲精品一部二部 | 成人免费在线小视频 | 久草网站 | 欧美区在线观看 | 一区二区精品 | 国产高清精品一区二区三区 | 成人黄色电影在线播放 | 男人天堂色 | 91在线一区二区三区 | 日韩中文视频 | 国产在线中文字幕 | 成人精品一区二区 | 欧美在线观看免费观看视频 | 免费成人在线网 | www国产成人免费观看视频,深夜成人网 | 国产精品欧美一区二区 | 国产在线www| 超碰人人人人 | 久操亚洲 | 羞羞的视频在线看 | 久久一区二区三区电影 | 中国大陆高清aⅴ毛片 | 成年人在线观看视频 | 久久中文免费视频 | 精品国产一区二区三区性色av | 亚洲一区综合 | 九九九视频在线观看 | 国产情品| 成人av电影在线 | 欧美日韩中文字幕 | 毛片免费视频 |