成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為何大語言模型不會取代碼農?

譯文
人工智能
大語言模型(LLM)有望給軟件開發界帶來的好處是可以將碼農變成架構師。不過,并非所有LLM都天生一樣。

譯者 | 布加迪

審校 | 重樓

生成式人工智能(GenAI)會取代人類程序員嗎?恐怕不會。不過,使用GenAI的人可能會取代程序員。但是如今有這么多的大語言模型(LLM),實際效果不一而足。

如果在努力跟上所有LLM,并非只有您一個。我們目睹一場激烈的LLM競賽。單單谷歌的GenAI產品已經變得非常豐富——最新的開放模型Gemma是LLM快速精簡的最新例子,甚至可以稱之為小語言模型。

DevOps社區更密切相關的是我們看到其他用于生成代碼的LLM閃電般的開發速度,比如Meta最近更新的Code Llama 70B。當然,GenAI了不少開發者。最近的一項研究發現,近一半的開發者于自己憑借目前的技術技能在GenAI界取得成功表示擔憂。

這種擔心真的有道理嗎?關于人類程序員死的說法可能夸大其辭了。人類甚至可能實際上有更多的時間來準備迎接GenAI主導的世界。

事實上,開發者應該詢問的更適當的問題不是GenAI會搶走我的工作嗎?”,而是我該使用哪個LLM?”

太龐大了,編程沒法成功

LLM軟件開發界的承諾是有望將碼農變成架構師。然而,并非所有LLM都天生一樣;值得探討的是,為什么一開始就涌現了較小巧LLM

強大的主流模型(比如GPT-4Claude 2仍然只能勉強解決不到5%的實際GitHub問題。ChatGPT仍然存在嚴重的幻覺問題:假變量,或者甚至十多年前就已經被棄用的概念。此外,它讓沒用的內容看起來很有用。您可以嘗試利用提示工程來擺脫這些沒用的內容,但是有益的上下文數量存在一個最佳平衡——太多會導致更混亂隨機的結果,白白耗費了更多的處理能力。

LLM編程方面更大的問題是信任。在過去,主流LLM不加區別地吸收網上的一切內容,就像一個大型數字吸塵器,至于它們從哪里獲取數據缺乏透明度。哪怕一家公司交付的代碼中僅僅1%含有另一家公司的受版權保護的代碼,這也是個問題。您可以想象噩夢般的召回場景:交付的產品沒有無線傳輸功能挑出可疑代碼。

不過,LLM格局正在迅速改變。

LLM對于編碼夠專業嗎?

當Meta在今年早些時候宣布對其Code Llama 70B進行更新時,感覺這是受歡迎的嘗試,有望解決主流LLM對編碼缺乏關注的問題。它有三種不同大小的版本:70億個參數、130億個參數和340億個參數。它還使用代碼的5000億個token和與代碼相關的數據進行訓練,包含10萬個token龐大上下文窗口。

從理論上講,其中最令人興奮的是Code Llama Python,這是專門為Python設計的Code Llama版本——主要是由于它代表了LLM未來的發展方向。與Meta的大型科技同行開發的一些模型不同,這個模型完全致力于一種特定的語言編程,使用Python代碼的大約1000億個額外token進行訓練業界更加需要的正是針對特定用例的這種級別的定制建模。

之所以需要強調理論上令人興奮”,是由于像Code Llama這樣的LLM對開發者到底有多用還有待觀察。去Reddit看看,就會發現早期的結論似乎是,該模型因諸多問題而令人沮喪,其中包括復雜的提示格式、過于嚴格的護欄,最重要的還有幻覺問題。最后一點是另一個不爭的事實,提醒人們:任何模型的好壞完全取決于訓練它所使用的數據。

不管是否存在缺陷,Meta的定制LLM方法已經引起了人們的重視,即大語言模型并不是AI輔助代碼生成取得成功的唯一途徑。我們看到,業界越來越青睞使用規模較小、更專門化的LLM編寫代碼,比如BigCode、Codegen和CodeAlpaca。StarCoder是另一個LLM,盡管只有155億個參數,但在評估基準測試表現卻勝過PaLMLaMDA和LLaMA等大模型。

每一種選擇都有優缺點,但最重要的是,小模型用起來比大模型安全得多。如果在用C++編程,果真需要您的LLM充斥著一大堆不相關的知識(比如“誰是美國第三任總統?”)嗎?數據池越小,保持內容的相關性就越容易,模型的訓練成本就越低,無意中竊取他人受版權保護數據的可能性也就越小。

2024年的DevOps團隊應該徹底調研市上所有可用的LLM選項,而不是默認選擇最明顯的選項。甚至可能有必要針對不同的用例使用不止一種LLM。

但回到當前存在問題……

GenAI會取代人類嗎?

這些GenAI工具有可能代替真正程序員嗎?除非模型提供的編程答案具有的準確性提高可接受的誤差范圍內即98%-100%,否則可能代替不了。

不過為了便于討論,我們假設GenAI確實達到了這個誤差范圍。那么這是否意味著軟件工程的角色將發生轉變,只需審查和驗證AI生成的代碼,而不是編寫代碼?如果四眼原則(four-eyes principle)適用的話,這樣的假設可能是錯誤的。這是內部風險控制最重要的機制之一,要求任何實質性風險的活動比如交付軟件都要由第二個、獨立的、有能力的人進行審查和復核。除非AI被重新歸類一種獨立的、有能力的生命,否則它短期內應該沒有資格成為四眼原則中的另一雙眼睛。

如果GenAI將來有能力進行端到端開發和構建人機界面,那也不會是在不久的將來。LLM可以充分地與文本和圖像元素進行交互。甚至現在就有工具可以將網頁設計轉換成前端代碼。然而與編碼相比,AI單獨承擔與圖形和UI/UX工作流程相關的設計要困難得多,盡管并非不可能。編碼也只是開發的其中一部分。剩工作就是另辟蹊徑,弄清楚誰是受眾,將想法轉化為可構建的產品,然后加以完善和改進,是人類發揮作用的地方。

不管LLM變得有多好,對于程序員來說,有一條原則應該始終不變:像對待自己編寫的代碼一樣對待每一段代碼。同行評審,詢問同事這是好的代碼嗎?”。永遠不要盲目相信代碼。

原文標題:Why Large Language Models Won’t Replace Human Coders,作者:Peter Schneider

責任編輯:華軒 來源: 51CTO
相關推薦

2025-05-23 08:18:52

2024-10-22 17:24:32

2023-09-20 08:00:00

大語言模型代碼庫

2024-12-20 07:30:00

2020-05-19 13:49:43

C語言Java語言

2024-02-26 08:15:43

語言模型低代碼

2016-11-02 09:38:05

容器虛擬機服務器

2020-01-15 08:42:16

TCP三次握手弱網絡

2024-05-27 08:00:00

人工智能大語言模型

2025-02-07 12:54:57

大語言模型LLM

2023-04-13 22:04:16

AI人工智能

2024-01-12 10:29:26

2024-12-02 09:37:09

大模型AI產品

2019-12-27 08:00:40

NAND存儲DRAM

2025-04-22 08:08:37

2025-04-10 07:59:51

2024-06-06 08:06:19

鴻蒙大語言模型LLM模型

2023-11-27 14:48:34

人工智能深度學習大語言模型

2024-03-19 13:12:36

自動駕駛模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美a√ | 亚洲高清视频在线 | 国产高清精品一区 | 日日夜夜91 | 日韩精品在线看 | 中文字幕第一页在线 | 天天综合久久 | 91黄色片免费看 | 午夜免费视频 | 亚洲视频观看 | 久久久久国产一区二区三区四区 | 三级黄色片在线 | 欧美一区二区三区精品 | 欧美片网站免费 | 免费黄色片在线观看 | 国产综合精品一区二区三区 | 亚洲国产成人精品女人久久久 | 国产精品久久久久久二区 | 久久99精品久久久久蜜桃tv | 欧美激情综合 | 日本在线播放一区二区 | 国产激情精品 | 黄网站涩免费蜜桃网站 | 91 久久 | 亚洲人成在线播放 | 欧美黑人狂野猛交老妇 | 免费成人高清在线视频 | 欧洲av在线 | 欧美中文在线 | 亚洲激情网站 | 精品在线一区 | 亚洲精品三级 | 一区二区视频免费观看 | 亚洲九色 | 99re热精品视频 | 人人干人人爽 | 九九热在线视频免费观看 | 国产精品日日做人人爱 | 操亚洲| 三极网站 | 综合久久av|