谷歌性價比之王 Gemini 2.5 Flash-Lite發布:最快輕量版AI模型! 原創
今天凌晨,谷歌更新了 Gemini 2.5 系列模型:Gemini 2.5 Pro、Gemini 2.5 Flash發布正式版并進入穩定運行階段,并推出Gemini 2.5 Flash-Lite預覽版。
?
?
Gemini 2.5 Flash Lite在在編程、數學、科學、推理和多模態基準測試中,全面超越了 2.0 Flash-Lite,廣泛任務延遲低于2.0 Flash-Lite和2.0 Flash。谷歌稱這一模型為其最經濟實惠、速度最快的2.5系列模型。
?
?
并且,它在翻譯和分類等高容量、延遲敏感的任務中表現尤為出色。在翻譯工作中,不僅能夠快速給出翻譯結果,而且保證了高準確性和流暢度。
?
與 2.0 Flash-Lite 和 2.0 Flash 相比,它在廣泛任務樣本中的延遲更低,縮短了首個 token 的獲取時間,實現了更高的每秒 token 解碼速度,這使得它在處理任務時反應迅速,幾乎能做到即時響應。
?
同時,Gemini 2.5 Flash-Lite允許通過 API 參數動態控制思考預算,雖然 “思考” 功能默認處于關閉狀態,但開發者可根據實際需求靈活開啟,以應對不同復雜程度的任務。
?
DeepMind研究副總裁Oriol Vinyals展示了一個應用示例——Neural OS(神經操作系統)。這個看似普通的操作系統界面,實際上所有內容都是用戶點擊圖標后由Gemini 2.5 Flash-Lite實時生成的。
?
“這本質上是一個非確定性操作系統”,Vinyals解釋道,“當你退出文件夾再重新進入時,里面的內容可能已經完全改變?!边@種實時生成能力展示了Flash-Lite在低延遲場景下的卓越性能。
?
Gemini 2.5 Flash-Lite擁有 100 萬個 token 的上下文長度,能夠處理長篇幅、復雜的內容,充分理解前后文的邏輯關系,從而給出更貼合需求的回答。
?
在數學方面,Gemini 2.5 Pro的表現略遜色于OpenAI o4-mini,圖像理解方面分數略低于OpenAI-o3 high。
?
?
在價格方面,Gemini 2.5 Flash-Lite 展現出了超高的性價比。它比 Gemini 2.5 Flash 便宜 30%-60%,輸入價格僅為 0.1 美元(折合人民幣約 0.7 元)/ 百萬 tokens,輸出價格為 0.4 美元(折合人民幣約 2.9 元)/ 百萬 tokens 。
?
目前,Gemini 2.5 Flash-Lite 預覽版已在谷歌 AI Studio 和 Vertex AI 中上線,開發者們可以第一時間體驗它的強大功能。
?
同時,Gemini 2.5 Flash 和 Pro 穩定版也已全面可用,并且谷歌還為谷歌搜索功能引入了 2.5 Flash-Lite 和 Flash 的定制版本,讓廣大用戶在日常搜索中也能感受到 AI 技術帶來的高效與便捷。
?
Gemini2.5系列的發布,標志著谷歌在推理速度和經濟性方面取得了新的突破。
?
大家怎么看?歡迎在評論區留言討論~
