OpenAI重磅更新定檔下周一,奧特曼暗示會有「魔法」!
確認了,沒有GPT-5,沒有搜索引擎,但還會有驚喜!
OpenAI今天官宣預告,即將在13日,下周一上午10點(太平洋時間)開啟線上直播。
屆時,會有全新的ChatGPT demo演示,以及GPT-4升級更新。
傳送門:https://openai.com/(OpenAI還在網頁UI整了個小心機設計,一點滿屏字頗有趣味)
而Altman本人更是興奮地表示,「對我來說,感覺就像魔法一樣」。
本來,發布「搜索引擎」這件事基本實錘,甚至連路透援引內部人士消息這篇報道,昨天在全網瘋轉。
然而,發布時間是對上了,但奧特曼突然變卦,直言「沒有搜索引擎」。
據網友爆料,這是OpenAI投出的誘餌,目的是揪出內部泄密者。而經常給Jimmy Apples、Flowers泄密的爆料人,已經被OpenAI解雇。
不得不說,還是OpenAI套路深。
那么,萬眾期待的GPT-5沒有,確認了再確認的「搜索引擎」也沒有,下周一OpenAI的「魔法」究竟是啥?
Information獨家報道,OpenAI正在開發一個全能的AI語音助手,預計在下周展示。
這項新技術可以通過聲音和文本,與人交流,可以聽出不同人的語調、語氣,并能識別物體和圖像。
網友紛紛表示,又是沒等到GPT-5的一天。
Her即將成真!AI語音助手要來
其實,OpenAI希望,能夠開發出一款像人類一樣交流的AI。
Altman曾表示,自己對Spike Jonze導演的電影《Her》深感興趣,并稱其具有預見性。
在這個影片中,講述了主人公愛上了一個對話操作系統——Semantha,并在互動過程中,AI也逐漸熟悉了他。
「她」記得他的故事,他的習慣,還發展出了自己的個性。
因此,打一開始,OpenAI致力于最終開發出類似于《Her》中的虛擬助手,同時讓現有語音助手,如Siri更加出色。
新模型有音頻輸入、音頻輸出功能,以及更好的推理能力。在一些查詢上甚至超過了GPT-4 Turbo
據兩位知情人士透露,OpenAI已經向一些客戶展示了這項新技術,包括優于現有模型的邏輯推理能力在內的多項能力。
而且,預計在下周一的活動中,將首次公開展示這款進階后的AI。
可以確認的是,OpenAI這波操作再次截胡谷歌,搶占奪人眼睛的先機。
谷歌預計在14日召開I/O大會(OpenAI掐點的直播時間真及時,簡直不給谷歌留下喘氣的機會)
據網友發現,在Altman官宣不會發布「搜索引擎」,谷歌的股價立馬飆升。
精準識別語調語氣,但體積太大裝不進手機
OpenAI團隊篤定的是,具備視覺+音頻能力的AI助手,可能會像智能手機一樣,將給世界帶來顛覆性的變革性。
ChatGPT,還只是這類強大AI助手的雛形。
理論上,他們設想的這款AI助手,可以完成不可能的任務。
比如,指導學生寫論文、解決數學難題,或人們詢問時,提供及時豐富的信息、翻譯標志,甚至指導如何修理故障的汽車。
不幸的是,OpenAI這款AI目前體積太大,根本無法在個人終端設備運行。
不過,客戶可以在短期內使用基于云的版本,來增強OpenAI已經支持的軟件功能,例如自動客戶服務智能體。
另據了解這項AI的人透露,新軟件的音頻功能可以幫助,這些智能體更精準地理解來電者的「語調」,以及他們是否在提出請求時使用「諷刺語氣」。
目前,OpenAI已經開發了用于轉錄音頻(Whisper)以及文本轉語言(TTS)的模型。
ChatGPT背后便集成了這些能力,不過在用到的時候,需要分別調用這些工具。
據稱,OpenAI即將推出的新模型,將這些能力整合到一個模型之中,即打造一個「原生多模態模型」。
這個全新多模態模型,在理解圖像和音頻方面表現更佳,同時其響應速度也超過了那些能力較弱的模型。
微軟搶先體驗
一如既往,OpenAI更新那天,作為「金主爸爸」的微軟,定是最先用上新功能的那個人。
預計,微軟將會利用OpenAI新技術升級自己的語音助手。
而且,他們設想試圖去壓縮這個技術,以便將其「裝進」包括配備前置攝像頭的可穿戴設備中,能夠捕捉到用戶的周圍環境。
不過,目前雖尚不清楚OpenAI何時會向其付費客戶提供這些新功能,但最終目標是,將其納入ChatGPT的免費版本中。
據一位體驗過的人士透露,OpenAI的目標是,讓具備新功能的AI模型的運營成本,低于其當前收費的最尖端的模型GPT-4-Turbo。
他還指出,新模型在回答某些問題上表現得更好。然而,它依舊會出現「幻覺」。
GPT-5年底前發,冰山之下深藏的秘密
OpenAI的領先優勢,幾乎無人能及。
一直以來,谷歌高管夢想著,利用AI開發出強大的助手。
去年12年,谷歌首次展示了對話AI「Gemini」,能夠實時響應人的語音指令,并識別人類正在觀看的圖片。
一時間,這個宣傳視頻在全網掀起軒然大波,讓許多人瞬間對谷歌刮目相看。
沒想到,還沒發布一天,視頻竟被曝出「造假」?!
谷歌隨后解釋,這些能力的實現,需要研究人員通過圖片和文本指令來引導模型,并非視頻所展示的那種簡單對話。
此后,隨著Gemini的迭代升級,也增加了一些新功能,除了分析圖像和文本之外,還能分析音頻。
盡管如此,它依舊不能理解多數傳統語音命令,也不能像Siri和Google Assistant等傳統語音助手那樣與用戶進行交流。
而OpenAI即將發布的AI語音助手,或許對谷歌來說,又是一個致命性的打擊。
另外,OpenAI也在全力以赴,確保自己在AI領域的領先地位,不被主打「開源王牌」的Meta趕超。
今年4月,Llama 3的8B和70B版本發布,并預告了400B+開源大模型,直接狙擊GPT-4。
而具備「音頻+視覺」能力的AI模型,只是OpenAI正在開發的眾多產品之一。
雖這次不會發布「網絡搜索引擎」,但這件事確實在OpenAI內部正在推進,就是為了與谷歌搜索競爭。
畢竟,OpenAI在上周的主頁中,已經對外展示了一個新的UI。
此外,OpenAI還在開發一種自動化軟件,稱為「計算機操作智能體」(computer-using agent)。
該軟件有望加速軟件開發,及其他計算機相關任務。
另外,今年年初,AI視頻生成器Sora的誕生,已經在好萊塢掀起巨震,雖然目前尚未公開發布。
更重要的是,GPT-5也在默默推進中,并且要顯著優于GPT-4。知情人士透露,OpenAI可能在今年年底前完成GPT-5的開發,并公開發布。
之所以,OpenAI內部在產品和AI模型開發上進展迅速,是因為此前宣布的項目,未能獲得足夠的關注。
比如,他們曾承諾開發者最在今年第一季度,通過構建定制聊天機器人,來為其商店賺錢。
但到目前為止,OpenAI尚未推出實現這一目標的具體方式。
ChatGPT裝進iPhone,與蘋果合作基本達成
另一方面,打造視覺+音頻AI助手可以幫助OpenAI,將其能力引入數億,甚至數十億的蘋果設備中。
就在剛剛,彭博報道稱,蘋果與OpenAI正在敲定一項協議,貌似接近尾聲,基本達成。
這項協議,即將為今年的iOS提供全新的生成式AI能力。
此前,還曾爆出蘋果與谷歌就Gemini的談判正在進行中,不過還未達成協議。
畢竟,距蘋果今年的開發者大會WWDC(6月10日),留給蘋果的時間不多了。
多家媒體爆料稱,這屆大會將AI整合進全新iOS 18系統中。
對于大家的期待,蘋果可不想辜負。
硬件設備,OpenAI也要自己做
此外,Altman還與iPhone設計師Jony Ive合作,去開發一款獨立的AI消費設備。
Information曾報道,這款一個硬件可能從Emerson Collective和Thrive Capital等投資者那里,籌集到高達10億美元的資金。
過去一年,AI Pin、Rabbit R1等AI驅動的設備和可穿戴產品蜂擁而出,Altman此舉也是希望加入這一陣列。
不得不承認的是,即便OpenAI最先進的AI模型推出,也將因其龐大的規模,只限在云端運行,并且需要聯網操作。
而未來,若想讓復雜的具備「視覺+音頻」的對話AI,縮小到足以在設備上運行,可能還需要幾個月,甚至幾年的時間。
全網大預測:智能體、gpt4-lite...
OpenAI這波官宣,可謂是戳中了所有人的興奮點。
爆料人Jimmy Apples又來泄密,「預計下周,我們會看到智能體的發布」。
而「搜索引擎」可能會在蘋果WWDC大會上,一起發布。
OpenAI研究科學家Bowen Cheng甚至表示,要發的可比GPT-5酷多了。
不知為何,這個帖子目前卻被刪除了。
另一位OpenAI負責視頻生成的科學家Will Depue發了一張圖,不知在暗示著什么。
還有一位網友Siqi Chen預測下周一,在GPT-4模型方面的更新:
- gpt4-lite:替換gpt-3.5
- gpt4-auto:一個新的模型端點(endpoint),可自動從網絡檢索數據,并集成內部數據來增強響應(不是「搜索引擎」)
- gpt4-lite-auto:與gpt4-auto類似,但使用的是lite版本。
同樣,也有人稱,gpt4-lite即將發布。
離職OpenAI,入職谷歌的Logan Kilpatrick表示,「6個月后,AI領域的格局將會完全不同。大多數人會對事情的發展感到驚訝」。
還有一個疑問是,OpenAI這次會對,gpt2做解釋嗎?
接下來一個月,AI海嘯將翻涌而來。
關于GPT-5何時面世,最近Altman在All-In Pod中回應,「我甚至不確定我們是否會命名它為GPT-5」。
他暗示,未來可能不再遵循GPT N+1的發布模式,而是轉向持續的改進過程。
但,GPT-5還得再等等。