ChatGPT新突破!Codex云開發助手,多任務并行的未來已來 原創
在當今數字化飛速發展的時代,軟件開發的效率和質量已經成為企業競爭的核心要素。今天,一個令人振奮的新突破悄然降臨——Codex,一款由ChatGPT推出的云開發助手,它正悄然改變著軟件開發的面貌。
一、Codex:多任務并行的云開發助手
Codex是一款強大的云開發助手,它能夠同時處理多個任務。無論是編寫新功能、解答代碼問題、修復漏洞,還是提出待審核的拉取請求,Codex都能輕松應對。每個任務都在獨立的云沙盒環境中運行,預加載了你的代碼庫,確保任務的獨立性和安全性。
Codex背后的技術支持是codex-1,這是OpenAI的o3版本,專門為軟件工程優化而成。它通過強化學習在真實世界的編碼任務中進行訓練,生成的代碼風格與人類開發者高度一致,嚴格遵循指令,并且能夠通過迭代測試直到獲得通過結果。
二、如何使用Codex
使用Codex非常簡單。用戶只需通過ChatGPT的側邊欄訪問Codex,并通過輸入提示詞并點擊“Code”來分配新的編碼任務。如果你想向Codex詢問有關代碼庫的問題,只需點擊“Ask”即可。每個任務都在獨立的環境中處理,Codex可以讀取和編輯文件,運行命令,包括測試框架、代碼檢查工具和類型檢查器。任務完成通常需要1到30分鐘,具體取決于任務的復雜性,你可以實時監控Codex的進度。
當Codex完成任務后,它會在其環境中提交更改,并通過終端日志和測試輸出提供可驗證的證據,讓你能夠追溯任務完成過程中的每一步。你可以審查結果,請求進一步修訂,打開GitHub拉取請求,或者直接將更改集成到你的本地環境中。
三、Codex的智能引導
Codex可以通過在你的代碼庫中放置AGENTS.md文件來引導。這些文件類似于README.md,你可以通過它們告訴Codex如何導航你的代碼庫,運行哪些命令進行測試,以及如何最好地遵循你的項目標準實踐。就像人類開發者一樣,Codex在配置了開發環境、可靠的測試設置和清晰的文檔時表現最佳。
四、Codex的安全性和可靠性
Codex作為研究預覽版發布,遵循迭代部署策略。設計團隊在設計Codex時優先考慮了安全性和透明度,以便用戶可以驗證其輸出。用戶可以通過引用、終端日志和測試結果來檢查Codex的工作。當Codex不確定或遇到測試失敗時,它會明確溝通這些問題,使用戶能夠做出明智的決策。盡管如此,用戶在集成和執行之前仍然需要手動審查和驗證所有由代理生成的代碼。
五、Codex的性能表現
在編碼評估和內部基準測試中,即使沒有AGENTS.md文件或自定義腳手架,codex-1也表現出色。例如,在SWE-Bench Verified測試中,codex-1的準確率達到了75%,遠高于其他模型。
六、Codex的未來發展
Codex目前仍處于早期發展階段。作為一個研究預覽版,它目前還缺少一些功能,比如前端工作中的圖像輸入,以及在代理工作時進行糾正的能力。此外,將任務委托給遠程代理比交互式編輯需要更長的時間,這可能需要一些時間來適應。隨著時間的推移,與Codex代理的互動將越來越像與同事進行異步協作。隨著模型能力的提升,預計代理將能夠處理更復雜的任務,并且持續時間更長。
本文轉載自??Halo咯咯?? 作者:基咯咯
