ChatGPT化身生活操作系統:奧特曼預告下一代頂級AI
OpenAI計劃發布一個非常強大的開源模型。
它能夠讓人們在本地運行極其強大的模型,重新認識“本地部署”的可能性。
在舊金山AI初創學校對話中,奧特曼宣布了以上消息。這場對話由Y Combinator的首席執行官Garry Tan主持。
期間,他們還討論了OpenAI的發展過程、未來方向、ChatGPT的起源和AI硬件的構建。
奧特曼談到,o3模型上周的運行成本是本周的5倍,價格下降趨勢還在繼續,且API的成本將會持續大幅下降,開源模型將會非常棒。Chatgpt的記憶功能不僅僅是一個小硬件,而是AI伴侶一般的存在。
未來,GPT-5以及多種推理模型將往集成模型方向發展,并與AI智慧終端以及機器人連接,成為人們的生活操作系統。
他還說到,如果用戶注冊最高級別的ChatGPT訂閱,將會給他們免費贈送一個機器人。
在不改變原意的基礎上,在此做了以下整理。
GPT推理模型的未來
Tan:最新的o3型號最讓您感到驚訝的是什么,目前有哪些新興行為或用例讓您印象深刻?
奧特曼:我認為我們正處在一個非常有趣的時代。雖然目前我們還沒有看到達到新的創新水平的推理模型產品,但是這個世界的模型能力已經進入了一種新的領域,我們仍然有大量全新的事物需要去構建。
我們很快就會推出一個令你們驚訝的開源模型。我認為它會比你希望的要好得多,你將能在本地運行非常強大的模型。同時,API的成本將會持續大幅下降,開源模型將會非常棒。
Tan:對我來說,記憶甚至變成了一種與了解我的人對話的感覺,這很有趣。
奧特曼:是的,記憶是我們今年推出的我最喜歡的功能。
我認為這指向了我們希望產品的方向。那就是你將擁有一個實體,它可以了解你,連接到你所有的東西,并主動幫助你。
這不會像你發送一條消息然后它又回復你一條消息那樣。它會一直運行,會查看你的東西,會知道何時向你發送消息,會知道何時為你做某事。
你會擁有特殊的新設備,它會集成到你使用的每項服務中,并且伴隨你一生。
當這個系統在后臺持續運行并不斷向你推送內容時,這個交互區域會變得更加豐富。而當我們推出首款新設備時,這里還會新增更多功能或內容。
但我認為它的關鍵不在于那塊小硬件,這個東西已經發展到可以在后臺運行并感覺像是一種人工智能伴侶的程度。
Tan:我想我們看到LMS與真實數據集成的強大功能,我聽說MCP即將登陸OpenAI。實際的整合有什么令人驚訝的地方?你知道,在YC我們實際上內部擁有代理基礎設施并且我們一直在使用它。
奧特曼:人們無疑開始使用ChatGPT作為操作系統,將他們的整個生活都融入其中。
整合盡可能多的數據源,以及始終伴隨你的設備,例如新型網絡瀏覽器,與所有數據源的連接、內存以及持續運行的模型,如果你把所有這些放在一起,它會是一個非常強大的地方。
Tan:您認為它未來會出現在云端,還是會出現在我們的桌面上,或者兩者兼而有之?
奧特曼:會是所有這些的混合。人們肯定會為某些事情運行本地模型,如果我們可以將一半的聊天工作負載推送到本地設備上,沒有人會比我們更高興。至于云端部分 ,我認為我們很快就會運行世界上最大最貴的基礎設施。Tan:在云端運行,計算難度之大令你感到驚訝嗎?奧特曼: 我們很擅長從零開始。就像兩年半前我們還沒有ChatGPT.com一樣, 現在已經發展成為世界第5大網站。
GPT-5和多模態超級模型的愿景
Tan:o3、o4mini推理模型與像4o這樣的多模型并行發展,這兩個線程匯聚在一起時會發生什么 ?GPT-5及以后的愿景是什么?
奧特曼:我們無法通過GPT-5實現所有目標,但我們最終確實想要一個集成模型,它可以在需要時進行推理,并在需要時生成實時視頻。
如果你問一個問題,你可以想象它會非常努力地思考,做一些研究,編寫一堆代碼,就像一個全新的應用程序供你使用。我認為這像一種真正的新型計算機界面,AI在某種程度上已經做到了這一點,但是當我們得到一個真正完整的多模態模型時,比如完美的視頻、完美的編碼及一切深度推理,感覺會非常強大。
Tan:這似乎是向具體化邁出的一步。你知道擁有視覺、語言和推理能力的機器人是我們想要的機器人的飛躍。
奧特曼:我們的策略是先解決這個問題,然后確保我們可以將其連接到機器人上。
但機器人的時代很快就要到來了,我想如果你注冊最高級別的ChatGPT訂閱時,我們會向你免費贈送一個機器人。
Tan:在現實世界擁有做實際工作的機器人,這是多么瘋狂的未來。
奧特曼:我覺得我們離目標已經不遠了。雖然機器人的機械工程非常復雜,AI 的認知能力也同樣具有挑戰性,但整體來看,我們正逐步掌握這些關鍵問題。
我認為幾年后機器人就能做一些非常有用的事情,但制造十億個機器人仍需要一段時間,我也不知道需要多少機器人能夠完成自動化供應鏈,它們是否能運行整個供應鏈,比如驅動采礦設備、驅動集裝箱輪船等。
Tan:談到三級AGI,AI agent,Greg Brockman說最近是agent之年。有了操作員代碼解釋器這樣的工具,你認為哪些類型的工作流程將會消失或者出現,但我們現在還沒有做好準備。
奧特曼:長期以來,ChatGPT像是Google的高級搜索版本,仍像是替代品。
但是現在你可以真正將一項任務交給codeex進行深入研究。它能夠反饋相關建議,這就像一個初級員工可以在短時間做某項工作。
我認為使用當前的o3就能做到,更不用說我們下一個模型,你可以有很多這樣的體驗。
Tan:你如何看待人機交互和界面的未來?這些界面存在哪些局限性促使你這樣做?
奧特曼:就像今天的語音界面一樣,我認為它有點糟糕,因為效果不太好。
如果你能對電腦說:“這正是今天我想要完成的事,如果我被耽擱了或有任何變化,我相信你會在不打擾我的情況下,去做所有事。”
除非它是一個超級棒的人類助手,不然界面就會消失。希望我們能向人們展示一種不同的電腦使用方式。
AI for Science:Sam的個人賭注
Tan:展望未來十到二十年的時間里,您個人最興奮的是什么?現在人們應該構建什么來實現這樣的未來?奧特曼:這是一個難以想象的超級智能世界,我期待看到它的發展,而不是讓它成為一個模糊的答案。我認為AI應用到科學是我個人最興奮的。
我相信世界上所有長期可持續的經濟增長,就像所有能改善人們生活的事情一樣,基本上都在于發現新的科學,并擁有相當完善的治理機構,以便這些科學能夠得到發展并與世界共享。
如果我們能夠大幅度提升AI在科學探索中的速度,我相信能夠為每個人帶來提升和奇跡。
Open AI發展:人才吸引與競爭力
Tan:你是世界上最擅長聚集最聰明的人之一嗎?你在招聘方面學到的最艱難的教訓是什么?
奧特曼:招聘真正聰明,有動力高效能團隊合作的人,能讓你成功90%, 而人們在招聘過程中對其他事情的關注程度總是讓我感到驚訝。
招聘一個能夠保持良好的業績記錄,好奇心強、積極融入工作并與公司愿景保持一致的人,效果會很好。
Tan:保持良好的業績記錄是指那種在頂級機構擔任了二十年管理職位、擁有頂級聲譽的人?奧特曼:在創業初期,我不推薦招聘這樣的人。坦白說YC創業初期招聘過這樣富有管理經驗的人,但效果并不理想。
我們還是選擇招聘年輕有活力能完成任務的人,而不是那些有著極其輝煌履歷的人 。我會問,你做過印象最深刻的一次事情是什么。
Tan:擔任Open AI的CEO,總的來說,最難的教訓是什么?
奧特曼:我們必須同時做很多事情,而且有很多大公司以各種方式向我們發起挑戰。我們必須花費更多精力去處理這些問題,而且我們需要從一種重大決策方式切換到完全不相關但同樣重要的決策方式去應對和處理。
Tan:對于很多想要創建B2B、SAS的軟件工程師來說,如何在當下去完成一個復雜麻煩的事情?
奧特曼:現在是科技史上最佳的創業時機。成功之處在于,初創公司比其他大公司更容易迭代,且成本更低。大公司有很多優勢,但它們的迭代速度非常慢。但是,便宜的東西也很容易被取代,所以有很多角度去看待這個問題。
我建議這樣看待它們:每個人都會面臨同樣的挑戰和機遇,但是當行業周期變化如此之大,初創公司幾乎總是贏家,我們可能從未見過如此巨大的變化。
從這個方向出發采取行動,我認為你會處于非常有利的狀態,或許你可以邀請我談談,比如隨著時間的推移,你可以建立哪些防御性領域,我認為這是一個內在問題(內部問題)。
Tan:你會對學生時代的自己說些什么。
奧特曼:我希望有人能教我長期堅持信念和韌性,很多人在一次失敗后就放棄了,學習如何堅持下去,我認為這真的很重要。
培養對自己直覺的信任,并隨著時間推移不斷完善你的決策和直覺,從而增強這種信任。好的部分真的比你想象的要好得多,而困難的部分,難以用任何你能理解的方式表達出來。你必須堅持下去。
One More Thing
結果好巧不巧,沒過幾天他就公開發起投票,o3-mini水平的模型將在哪一年能在手機上運行?
截至完稿前,投票網友中,超過40%的人認為此模型2025年便可運行。
好好好,就在等著了(Doge)。