OpenAI突發新模型，GPT-3.5退役，大模型成本2年驟降99%

作者：量子位 2024-07-19 09:26:12

CEO奧特曼表示，僅僅兩年前，世界上最好的模型還是GPT-3的text-davinci-003版本。

OpenAI突發新模型，全面取代老去的GPT-3.5。

GPT-4o mini，能力接近原版GPT-4，價格卻要便宜一個數量級：

在ChatGPT應用中，GPT-3.5已經完全退役，免費用戶已可使用GPT-4o mini模型。

對應的API也已經開放，支持128k輸入tokens（圖像和文本），更令人矚目的是支持16k輸出tokens。

相比之下，隔壁Claude 3.5 Sonnet幾天前剛剛升級8k輸出tokens。

以其低成本和低延遲特性，官方推薦用于多種場景：

在未來幾天內，將開放GPT-4o mini微調。

CEO奧特曼表示，僅僅兩年前，世界上最好的模型還是GPT-3的text-davinci-003版本。

與今天相比表現差得多，還要貴上100倍。

或者換另一個說法，大模型成本在兩年內下降了99%。

GPT-4級別小模型，便宜一個數量級

ChatGPT首發震撼世界，原版GPT-3.5模型功不可沒。

但盡管經過一系列升級降價，系列最新型號GPT-3.5 Turbo也漸漸落后了。

競爭對手新出的小模型，以Anthropic的Claude 3 Haiku和谷歌Gemini Flash為代表，開始搶占市場。

GPT-4o mini就是專門來找回場子的。

在多項文本和多模態推理學術基準測試中，GPT-4o mini都超過了其他小模型。

特別是在數學（MGSM、MATH）和代碼能力（HumanEval）上優勢明顯，與其他小模型拉開一個檔次，只比GPT-4o完整版稍弱。

此外，它還在函數調用方面表現出強大的性能。

價格方面，也比Claude 3 Haiku和Gemini Flash要更便宜40%-60%。

作為模型開發的一部分，OpenAI與Ramp和Superhuman等公司合作，已將GPT-4o mini用于實際應用，在“從文件中提取結構化數據”和“對郵件通信記錄生成高質量回復”等任務明顯優GPT于 -3.5 Turbo。

此外幾周之前，新模型還化名GPT-mini登上大模型競技場供廣大網友測試檢驗。

目前收集到6000+用戶投票，與GPT-4 Turbo表現相當。

不過感興趣的可以在大模型競技場體驗，目前版本為gpt-4o-mini-2024-07-18。

這一次OpenAI對模型做了更多的安全設置，第一個應用了OpenAI指令層次結構方法的模型，有助于提高模型抵抗越獄、Prompt注入和系統Prompt提取的能力。

簡單測試中，確實不能簡單的一句話套出系統提示詞了。

不過用上一系列復雜的越獄手段之后，還是沒防住。泄漏出來的系統提示詞倒也沒什么特殊的內容。

不過很可惜，新模型還是搞不懂9.11和9.9哪個大……

此外奧特曼還在回復網友提問中透露，GPT-4o實時語音模式也就是《Her》，將于本月晚些時候Alpha測試，更晚一些正式發布。

不過也有網友略有點失望：我們要想要的是GPT-5，你卻給我GPT-4o mini。

同一天，DeepSeek與Mistral也都有了新進展。

一邊開源了 DeepSeek-V2-0628，直接摘得大模型榜單上開源大模型頭名。

另一邊則是推出了12B的小模型，同英偉達合作開發，上下文長度為128K。

大家打起來啊打起來啊~~~

責任編輯：張燕妮來源：量子位