成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛,Gemini 2.5系列模型更新,最新輕量版Flash-Lite竟能實(shí)時編寫操作系統(tǒng)

人工智能
谷歌 CEO Sundar Pichai 發(fā)推表示新推出的 Gemini 2.5 Flash-Lite 是目前性價比最高的 2.5 系列模型。

剛剛,Gemini 系列模型迎來了一波更新:

  • Gemini 2.5 Pro 穩(wěn)定版發(fā)布且已全面可用,其與 6 月 5 日的預(yù)覽版相比無變化。
  • Gemini 2.5 Flash 穩(wěn)定版發(fā)布且已全面可用,其與 5 月 20 日的預(yù)覽版相比無變化,但價格有更新。
  • 新推出了 Gemini 2.5 Flash-Lite 并已開啟預(yù)覽。

谷歌 CEO Sundar Pichai 發(fā)推表示新推出的 Gemini 2.5 Flash-Lite 是目前性價比最高的 2.5 系列模型。

可以看到,谷歌對 2.5 Flash-Lite 的定位是適合用于「量大且注重成本效率的任務(wù)」。相較之下,2.5 Pro 適合編程和高復(fù)雜度任務(wù),2.5 Flash 則居中,更適合需要較快速度的日常任務(wù)。

據(jù)官方博客介紹,Gemini 2.5 Flash-Lite 同樣是一個推理模型,同樣支持多模態(tài)輸入和 100 萬 token 上下文,并支持通過 API 參數(shù)動態(tài)控制思考預(yù)算。由于 Flash-Lite 針對成本和速度進(jìn)行了優(yōu)化,因此與谷歌 DeepMind 的其他模型不同,其「思考」功能默認(rèn)處于關(guān)閉狀態(tài)。除了函數(shù)調(diào)用之外,2.5 Flash-Lite 還支持已有的所有原生工具,例如基于谷歌搜索查找依據(jù)、代碼執(zhí)行和 URL 上下文。

性能上,Gemini 2.5 Flash-Lite 的整體表現(xiàn)自然會比 2.5 Flash 差一些,而開啟思考的版本也比沒開啟的更強(qiáng)。但在少量指標(biāo)上,2.5 Flash-Lite 卻意外地具有少量分?jǐn)?shù)優(yōu)勢,比如 AIME 2025 和 FACTS Grounding。

價格方面,自然也是與性能掛鉤的。如上圖底部所示,2.5 Flash-Lite 的定價為每百萬輸入 / 輸出 token 0.1/0.4 美元,而如果是音頻輸入,則為每百萬輸入 token 0.5 美元。2.5 Flash 的價格為每百萬輸入 / 輸出 token 0.3/2.5 美元,音頻輸入的則為 1 美元。性能最佳的 2.5 Pro 價格沒有變化,還是貴得多:每百萬輸入 / 輸出 token 1.25/10 美元。

Gemini 2.5 Flash-Lite 的預(yù)覽版現(xiàn)已在 Google AI Studio 和 Vertex AI 上線,與 2.5 Flash 和 Pro 的穩(wěn)定版本一同提供。用戶也可在 Gemini App 中使用 2.5 Flash 和 Pro。此外,谷歌還為 2.5 Flash-Lite 和 2.5 Flash 的定制版本引入了搜索功能。

另外,谷歌也發(fā)布了新版本的 Gemini 2.5 技術(shù)報告,從中我們可以看到有關(guān) Gemini 2.5 Flash-Lite 的更多信息,比如在性價比方面,Gemini 系列共同組成了當(dāng)前 LLM 的佩雷托前沿,是性價比最高的系列模型。

另外,該報告中還提到了一種名為「智能體恐慌(agent panic)」的現(xiàn)象,即在游戲過程中,Gemini 2.5 Pro 遇到了多種可能導(dǎo)致模型模擬「恐慌」的情況。

例如,當(dāng)隊(duì)伍中的寶可夢生命值或能量值較低時,模型會反復(fù)提醒自己需要立即治療隊(duì)伍或逃離當(dāng)前地牢。有趣的是,這種模型性能模式似乎與模型推理能力的定性可觀察到的下降相關(guān)——例如,在這種情況持續(xù)期間,在游戲過程中完全忘記使用探路工具。

報告地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf

作為當(dāng)今 AI 模型的頂流之一,Gemini 更新自然也吸引了萬眾矚目,很多用戶已經(jīng)嘗試并分享了自己的體驗(yàn)。

Datasette 開發(fā)者、著名技術(shù)博主 Simon Willison 用一篇博客分享了自己的體驗(yàn),下圖從左到右分別為 2.5 Pro、2.5 Flash 和 2.5 Flash-Lite 生成的鵜鶘騎自行車 SVG。

https://simonwillison.net/2025/Jun/17/gemini-2-5/

而輸出 token 數(shù)分別為 4,226、14,500、2,070,對應(yīng)成本分別為 4.2274、3.6253、0.0829 美分。

另外,他還嘗試了將一個新的 Twitter Space 的錄音轉(zhuǎn)錄成文本。結(jié)果發(fā)現(xiàn),2.5 Pro 的效果最好,總成本為 18.1 美分,時間 147.5 秒;2.5 Flash 也不錯,消耗 10 美分和 72.6 秒。但 2.5 Flash-Lite 卻遭遇了錯誤,中途卡住了。

DeepMind 研究 VP 和深度學(xué)習(xí)負(fù)責(zé)人 Oriol Vinyals 則通過一個更加亮眼的示例展示了 2.5 Flash-Lite,即所謂的 Neural OS / 神經(jīng)操作系統(tǒng)。這看起來像是一個操作系統(tǒng)的 UI,但實(shí)際上里面的內(nèi)容是用戶在點(diǎn)擊圖標(biāo)后由 2.5 Flash-Lite 實(shí)時生成的!

可以說這是一種非確定性(non-deterministic)的操作系統(tǒng) —— 當(dāng)你退出一個文件夾再重新進(jìn)入,里面的內(nèi)容可能就已經(jīng)完全不一樣了!

另外,谷歌開發(fā)者 ?? 帳號今天也分享了一些使用 Gemini 2.5 系列模型輔助開發(fā)的案例,比如 @splinetool 在其新的 Hana 工具中使用了 Gemini 2.5 Pro 來革新交互式 3D 設(shè)計。創(chuàng)作者可以使用自然語言生成對象和場景,并觀察它們?nèi)绾舞蜩蛉缟爻尸F(xiàn),從而簡化復(fù)雜的工作流程。

機(jī)器之心也在 Google AI Studio 中簡單實(shí)驗(yàn)了新推出的 2.5 Flash-Lite。

首先開啟 Thinking 模式,使用如下提示詞編寫一個小游戲:

編寫一個貪吃蛇小游戲,除了常規(guī)機(jī)制外,里面還要有障礙物。使用鮮艷多彩的顏色。

2.5 Flash-Lite 確實(shí)很快,僅用 17.1 秒就完成了任務(wù),效果也還不錯,就是障礙物過多了。

接下來,關(guān)閉 Thinking 模式,丟給它今年上海高考的作文題:

請完成這道作文題:

有學(xué)者用 “專”“轉(zhuǎn)”“傳” 概括當(dāng)下三類文章:“專” 指專業(yè)文章;“轉(zhuǎn)” 指被轉(zhuǎn)發(fā)的通俗文章;“傳” 指獲得廣泛傳播的佳作,甚至是傳世文章。他提出,專業(yè)文章可以變成被轉(zhuǎn)發(fā)的通俗文章,而面對大量 “轉(zhuǎn)” 文,讀者又不免期待可傳世的文章。

由 “?!?到 “傳”,必定要經(jīng)過 “轉(zhuǎn)” 嗎?請聯(lián)系社會生活,寫一篇文章,談?wù)勀愕恼J(rèn)識與思考。

要求:(1)自擬題目;(2)不少于 800 字。

2.5 Flash-Lite 僅用 5.9 秒就完成了任務(wù),至于結(jié)果,就交給你親自品鑒了:

最后,分享一個 Gemini 2.5 技術(shù)報告的貢獻(xiàn)者和致謝名單中隱藏的彩蛋:

你看出來了嗎?

參考鏈接:

  • https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/
  • https://blog.google/products/gemini/gemini-2-5-model-family-expands/
  • https://x.com/googleaidevs/status/1935103305581207923
責(zé)任編輯:趙寧寧 來源: 機(jī)器之心
相關(guān)推薦

2025-05-07 10:01:35

2025-06-23 00:00:01

2025-04-10 10:44:00

2025-06-18 14:18:23

谷歌模型技術(shù)

2009-04-11 15:12:24

vxworks操作系統(tǒng)

2025-04-10 06:16:33

2025-06-11 08:56:54

2012-10-11 10:03:32

FedoraLinux

2025-05-07 09:14:26

2025-05-07 10:09:08

2013-05-22 14:59:26

Linux操作系統(tǒng)實(shí)時性

2025-03-24 12:07:34

2010-03-01 13:05:52

2024-10-09 08:27:30

2022-02-09 19:31:41

Hi3861OpenHarmon鴻蒙

2021-06-22 09:09:34

V語言Vinix操作系統(tǒng)

2012-05-11 14:15:09

桌面操作系統(tǒng)最新排名

2012-05-29 10:53:22

FedoraLinux操作系統(tǒng)

2022-04-15 14:31:02

鴻蒙操作系統(tǒng)

2024-02-22 07:44:02

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久99精品国产99久久6男男 | 亚洲一区在线免费观看 | 亚洲成av| 国产精品1区2区3区 国产在线观看一区 | 日本一区二区三区四区 | a在线观看| 日日夜夜操天天干 | 午夜国产在线 | 欧美精品在线免费观看 | 日韩视频免费看 | 日本三级网站在线观看 | 91久久久久久久久 | 久久小视频 | 男女污污动态图 | 精品国产欧美一区二区三区成人 | 久久区二区 | 欧美日韩精品 | 日本三级全黄三级a | 在线观看www视频 | 九九热精品视频在线观看 | 欧美a∨| 成年人精品视频在线观看 | 日韩三级在线观看 | 日本天堂视频在线观看 | 欧美日韩久久精品 | 日韩一区二区视频 | 欧美不卡视频一区发布 | 精品久久国产视频 | 91原创视频在线观看 | 97伦理电影 | 亚洲综合精品 | 毛片免费视频 | 狠狠av | 美女久久久久 | 国产成人一区二区三区精 | 成人av资源在线 | 狠狠av| 久久免费精品视频 | 精品欧美乱码久久久久久1区2区 | 91免费看片 | 九九天堂网|