微軟:GPT-4下周發(fā)布,劍指多模態(tài),可支持視頻
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
GPT-4真的要來了!發(fā)布時(shí)間已確定:
就在下周。而且還是多模態(tài),可支持視頻。
聽到這個(gè)消息,網(wǎng)友們直接炸了鍋:大家都準(zhǔn)備好了嗎?
畢竟在一部分人眼中,ChatGPT都已經(jīng)如此驚艷,那GPT-4不得是這樣的?
(不過100萬億參數(shù)是謠言)
但也有網(wǎng)友質(zhì)疑其消息的真實(shí)性:不可能的。
質(zhì)疑確實(shí)也不無道理。OpenAI的進(jìn)展竟是微軟來宣布發(fā)布時(shí)間。
而且也還不是官方,而是在一個(gè)地方論壇上,由微軟德國CTO隨口說出。
△圖源:微軟
有網(wǎng)友表示:員工可能說錯(cuò)了。等待微軟和OpenAI的官方。
這究竟是怎么一回事?
微軟:GPT-4下周發(fā)布
據(jù)德國媒體Heise消息,當(dāng)?shù)貢r(shí)間3月9日一場人工智能相關(guān)活動(dòng)上,四名微軟德國員工在現(xiàn)場介紹了包括GPT系列在內(nèi)的大語言模型(LLM)。
微軟德國CTO Andreas Braun談到了LLM的顛覆性影響,是“游戲規(guī)則的改變者”——
因?yàn)樗麄兘虝?huì)機(jī)器理解自然語言,然后從統(tǒng)計(jì)學(xué)角度理解以往只有人類才能讀懂的東西。
目前這一技術(shù),已經(jīng)發(fā)展到基本上“適用于所有的語言”。
于是就談到了GPT-4的進(jìn)展:
我們將在下周推出GPT-4,會(huì)是多模態(tài)模型。這將提供完全不同的可能性,比如視頻。
多模態(tài)的出現(xiàn),微軟(-OpenAI)會(huì)讓大模型更加全面。
值得一提的是,前幾日微軟剛發(fā)布了多模態(tài)大語言模型Kosmos-1。它可以感知一般模態(tài)、遵循指令并執(zhí)行上下文學(xué)習(xí)。
Kosmos-1可以自然地處理感知密集型任務(wù)和自然語言任務(wù),比如視覺對(duì)話、視覺解釋、圖像字幕、簡單數(shù)學(xué)方程式、OCR等。
因此有媒體認(rèn)為,這樣一來GPT-4指向多模態(tài)似乎也并不稀奇。
除此之外,在這場論壇上,還有微軟德國的CEO Marianne Janik,全面談到了人工智能對(duì)企業(yè)創(chuàng)造性的“破壞”——目前人工智能開發(fā)和ChatGPT是“iPhone時(shí)刻”。
她談到,這并不意味著要更換工作,而是以一種跟以往不同的方式來完成重復(fù)性工作。新的職業(yè)也正在出現(xiàn),建議企業(yè)組建內(nèi)部“能力中心”,培訓(xùn)員工使用人工智能。
網(wǎng)友:等不及了
雖然此番GPT-4發(fā)布時(shí)間有待確定,但網(wǎng)友們確實(shí)也坐不住了!
比我預(yù)想的還快。
然后已經(jīng)有人開始想想GPT-4會(huì)是什么樣的了。
事實(shí)上自ChatGPT上線以來,GPT-4早已經(jīng)是千呼萬喚了。
據(jù)當(dāng)時(shí)披露,原本GPT-4在OpenAI內(nèi)部幾乎準(zhǔn)備就緒,只待發(fā)布;結(jié)果高層突然宣布新任務(wù):兩周后發(fā)布免費(fèi)聊天機(jī)器人應(yīng)用,代號(hào)“Chat with GPT3.5”,也就是今天見到的ChatGPT。
隨后又有爆料稱,GPT-4被曝接入微軟必應(yīng)搜索;GPT-4將有100萬億個(gè)參數(shù)。(也就是前文那個(gè)圖,不過很快被Open AI的CEO奧特曼否認(rèn)了)
現(xiàn)在至少是個(gè)微軟員工站出來說話,看來GPT-4已經(jīng)呼之欲出了。
巧的是,谷歌前兩天也發(fā)了個(gè)5620億超大模型PaLM-E。甚至連機(jī)器人都能用,在學(xué)術(shù)圈引發(fā)了不小的熱議。
怎的,微軟谷歌這兩家巨頭的第二波之爭,這就開始了?
以及如果GPT-4真就在下周發(fā)表,百度文心一言也在下周發(fā)布,剛好撞車…