成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

奧特曼曬“草莓”引熱議,神秘新模型現身競技場,網友第一波實測來了

人工智能
據今年7月路透社消息稱,多個內部人士透露,這個項目會讓公司的AI系統(tǒng)不僅能生成查詢的答案,而且能夠提前規(guī)劃,自主可靠地瀏覽互聯網,從而執(zhí)行OpenAI 所稱的“深度研究”(deep research)。

OpenAI神秘新模型,真的藏不住了!

先是有匿名聊天機器人現身lmsys競技場,聲稱自己是GPT-4系列模型一部分,吊足了大家的胃口。

圖片圖片

隨后奧特曼又發(fā)了一個浮想聯翩的推文,正是他花園里的草莓照片,并配文:i love summer in the garden。

上個月OpenAI正好被曝正在開發(fā)新一代基礎模型“草莓”,前身據說是之前神秘兮兮的Q*。

圖片圖片

不知是有意還是無意,但感覺就是有意,網友們就當奧特曼變相承認了。(Doge)

這就是對草莓計劃的引用!發(fā)布時間就是在夏天。(美國的秋天從9月22日開始)

圖片圖片

就在剛剛,ChatGPT官方推文開始走起了“圖片”的隊形,更顯得“有理有據”了。

圖片圖片

新模型現身競技場,網友第一波實測

最早在昨天下午,有網友發(fā)現lmsys競技場上多了個匿名新模型anonymous-chatbot。

圖片圖片

之前很多包括OpenAI在內很多科技公司都會發(fā)布前會進行一波測試。再加上它自稱是GPT-4模型系列一部分。

所以不少人懷疑OpenAI新模型要來了,也許就是草莓計劃或者Q*。

圖片圖片

圖片圖片

網友進行了第一波實測。

圖片圖片

像「9.11和9.9哪個大」這個“難題”也沒有挑戰(zhàn)成功。

圖片圖片

而讓它倒著寫單詞,同樣也沒回答出來。

圖片圖片

誒不過,說草莓這個單詞有多少個r倒是答對了。

圖片圖片

還有河流“難題”,也直接輕松解決,而不像之前其他大模型回答得過于復雜。

如果一個人和一只狗要過河,但有個船只能承載一個人和一只動物,請問怎么過去?

圖片圖片

最早在今年5月,OpenAI就被爆出正在開發(fā)“草莓”項目。

據今年7月路透社消息稱,多個內部人士透露,這個項目會讓公司的AI系統(tǒng)不僅能生成查詢的答案,而且能夠提前規(guī)劃,自主可靠地瀏覽互聯網,從而執(zhí)行OpenAI 所稱的“深度研究”(deep research)。

比如通過CUA(一種計算機代理)的幫助來自動瀏覽網頁,該代理可以根據發(fā)現內容采取行動。

這也是迄今一眾AI模型尚未解決的問題和難點。

草莓計劃前身是Q*

在眾多猜測中,草莓項目的前身極有可能是Q*。

去年11月,Q*首次被曝出,被認為過于強大,可能是通往AGI或超級智能的關鍵一步。

它被指具有這些特性,比如在數學和推理能力方面有很大的提升,突破了人類數據的限制,可以自己生產巨量訓練數據,有自主學習和自我改進的能力等等。

在草莓項目正式被曝光的前幾天,OpenAI科學家Noam Brown發(fā)了一條推特,感慨OpenAI總是會堅定地在重大研究方向上持續(xù)押注。

而這位科學家去年才跳槽到OpenAI,主要負責研究模型推理能力,之前一直被認為在研究Q*。

圖片圖片

最新曝光顯示,“草莓”使用的推理方法和2022年斯坦福發(fā)表的一種方法相似。

當時他們提出了一個自學推理(Self-Taught Reasoner,簡稱STaR)的方法。今年,斯坦福團隊又基于STaR,提出了一種名為Quiet-STaR的推理方式,也就是Q*了

知情人士表示,OpenAI希望通過該項目大幅提升AI模型的推理能力,“草莓”已經在非常大的數據集上完成預訓練,并使用了一種專門的處理方法,比如post-training等。

另外,內部之前也有過一次神秘模型的測試,當時數學測試成績超過90%,不過也沒法確認是否是Q*。

對此,OpenAI并沒有直接回應。聲明中表示:

We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.

(我們希望我們的AI模型能像我們一樣看待和理解世界。對新的人工智能能力的持續(xù)研究是該行業(yè)的常見做法,人們普遍認為這些系統(tǒng)隨著時間的推移在推理方面會有所改進。)

不過確實要說的是,距離OpenAI發(fā)布上一個重要基礎模型,也就是GPT-4,已經過去了近17個月的時間。差不多一年半了,也該來新一代模型了。

結果奧特曼現在又發(fā)一些云里霧里的推文。網友大開腦洞:

如圖所示這張圖有五個草莓,但第五個還沒有熟。而草莓成熟的時間在4-6周內,說明GPT-5也將在那時候發(fā)布。

圖片圖片

好好好,我信了。

參考鏈接:
[1]https://x.com/apples_jimmy/status/1821047312673890694

[2]https://x.com/flowersslop/status/1821054928275533900
[3]https://x.com/sama/status/1821207141635780938

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-07-03 14:57:51

DeepSeek模型AI

2023-07-14 13:32:05

2024-08-08 14:00:00

2025-01-24 13:08:18

2024-04-10 12:35:50

2013-03-25 14:10:02

Windows Blu

2024-11-21 12:09:26

2025-02-28 09:00:00

2025-03-05 09:32:00

2015-07-21 10:28:50

Windows 10更新

2012-05-31 14:20:14

2024-05-31 14:23:15

2024-12-31 12:35:46

2014-12-30 17:54:17

移動4G

2024-07-29 09:00:00

測評AI

2025-02-17 12:24:43

2024-09-29 12:50:10

2024-07-24 12:40:44

2015-09-06 09:21:05

升級功能Windows 10

2017-01-12 17:13:07

微信小程序
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕在线精品 | 亚洲美女视频 | 丝袜美腿一区二区三区动态图 | 国产日韩欧美一区 | 久久久不卡网国产精品一区 | 久久一二三区 | 欧美视频在线一区 | 在线观看午夜视频 | 国产精品久久久久一区二区 | 91亚洲国产成人精品一区二三 | 免费av播放| 亚洲国产二区 | 国产福利资源 | 97超碰站 | 大香网伊人 | 狠狠综合久久av一区二区老牛 | 亚洲成av人影片在线观看 | 日韩欧美在| 成人影院免费视频 | 在线一区视频 | 欧美精品乱码99久久影院 | 91tv在线观看 | 日韩午夜精品 | 免费看色 | 日本视频在线播放 | 色综合久| 亚洲精品久久久一区二区三区 | 日韩欧美在 | 亚洲97| a视频在线观看 | 中文字幕二区 | 久久久久久久久久久久亚洲 | 视频在线亚洲 | 91精品国产91久久久久游泳池 | 毛片免费观看 | 伊人久久大香线 | 91中文视频| 日韩免费在线 | 风间由美一区二区三区在线观看 | 综合久久综合久久 | 国产999精品久久久 日本视频一区二区三区 |