OpenAI突發新模型,GPT-3.5退役,大模型成本2年驟降99%
OpenAI突發新模型,全面取代老去的GPT-3.5。
GPT-4o mini,能力接近原版GPT-4,價格卻要便宜一個數量級:
- 每百萬輸入tokens,15美分(約1.09元人民幣)
- 每百萬輸出tokens,60美分(約4.36元人民幣)
在ChatGPT應用中,GPT-3.5已經完全退役,免費用戶已可使用GPT-4o mini模型。
對應的API也已經開放,支持128k輸入tokens(圖像和文本),更令人矚目的是支持16k輸出tokens。
相比之下,隔壁Claude 3.5 Sonnet幾天前剛剛升級8k輸出tokens。
以其低成本和低延遲特性,官方推薦用于多種場景:
- 鏈式或并行化多個模型調用
- 將大量上下文輸入給模型(如完整的代碼庫或對話歷史記錄)
- 或通過快速、實時的文本響應交互(如客服)
在未來幾天內,將開放GPT-4o mini微調。
CEO奧特曼表示,僅僅兩年前,世界上最好的模型還是GPT-3的text-davinci-003版本。
與今天相比表現差得多,還要貴上100倍。
或者換另一個說法,大模型成本在兩年內下降了99%。
GPT-4級別小模型,便宜一個數量級
ChatGPT首發震撼世界,原版GPT-3.5模型功不可沒。
但盡管經過一系列升級降價,系列最新型號GPT-3.5 Turbo也漸漸落后了。
競爭對手新出的小模型,以Anthropic的Claude 3 Haiku和谷歌Gemini Flash為代表,開始搶占市場。
GPT-4o mini就是專門來找回場子的。
在多項文本和多模態推理學術基準測試中,GPT-4o mini都超過了其他小模型。
特別是在數學(MGSM、MATH)和代碼能力(HumanEval)上優勢明顯,與其他小模型拉開一個檔次,只比GPT-4o完整版稍弱。
此外,它還在函數調用方面表現出強大的性能。
價格方面,也比Claude 3 Haiku和Gemini Flash要更便宜40%-60%。
作為模型開發的一部分,OpenAI與Ramp和Superhuman等公司合作,已將GPT-4o mini用于實際應用,在“從文件中提取結構化數據”和“對郵件通信記錄生成高質量回復”等任務明顯優GPT于 -3.5 Turbo。
此外幾周之前,新模型還化名GPT-mini登上大模型競技場供廣大網友測試檢驗。
目前收集到6000+用戶投票,與GPT-4 Turbo表現相當。
不過感興趣的可以在大模型競技場體驗,目前版本為gpt-4o-mini-2024-07-18。
這一次OpenAI對模型做了更多的安全設置,第一個應用了OpenAI指令層次結構方法的模型,有助于提高模型抵抗越獄、Prompt注入和系統Prompt提取的能力。
簡單測試中,確實不能簡單的一句話套出系統提示詞了。
不過用上一系列復雜的越獄手段之后,還是沒防住。泄漏出來的系統提示詞倒也沒什么特殊的內容。
不過很可惜,新模型還是搞不懂9.11和9.9哪個大……
One More Thing
此外奧特曼還在回復網友提問中透露,GPT-4o實時語音模式也就是《Her》,將于本月晚些時候Alpha測試,更晚一些正式發布。
不過也有網友略有點失望:我們要想要的是GPT-5,你卻給我GPT-4o mini。
同一天,DeepSeek與Mistral也都有了新進展。
一邊開源了 DeepSeek-V2-0628,直接摘得大模型榜單上開源大模型頭名。
另一邊則是推出了12B的小模型,同英偉達合作開發,上下文長度為128K。
大家打起來啊打起來啊~~~