微軟：GPT-4下周發(fā)布，劍指多模態(tài)，可支持視頻

作者：白交 2023-03-10 13:03:09

人工智能新聞

據(jù)德國媒體Heise消息，當(dāng)?shù)貢r(shí)間3月9日一場人工智能相關(guān)活動(dòng)上，四名微軟德國員工在現(xiàn)場介紹了包括GPT系列在內(nèi)的大語言模型（LLM）。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請聯(lián)系出處。

GPT-4真的要來了！發(fā)布時(shí)間已確定：

就在下周。而且還是多模態(tài)，可支持視頻。

聽到這個(gè)消息，網(wǎng)友們直接炸了鍋：大家都準(zhǔn)備好了嗎？

畢竟在一部分人眼中，ChatGPT都已經(jīng)如此驚艷，那GPT-4不得是這樣的？

（不過100萬億參數(shù)是謠言）

但也有網(wǎng)友質(zhì)疑其消息的真實(shí)性：不可能的。

質(zhì)疑確實(shí)也不無道理。OpenAI的進(jìn)展竟是微軟來宣布發(fā)布時(shí)間。

而且也還不是官方，而是在一個(gè)地方論壇上，由微軟德國CTO隨口說出。

△圖源：微軟

有網(wǎng)友表示：員工可能說錯(cuò)了。等待微軟和OpenAI的官方。

這究竟是怎么一回事？

微軟：GPT-4下周發(fā)布

微軟德國CTO Andreas Braun談到了LLM的顛覆性影響，是“游戲規(guī)則的改變者”——

因?yàn)樗麄兘虝?huì)機(jī)器理解自然語言，然后從統(tǒng)計(jì)學(xué)角度理解以往只有人類才能讀懂的東西。

目前這一技術(shù)，已經(jīng)發(fā)展到基本上“適用于所有的語言”。

于是就談到了GPT-4的進(jìn)展：

我們將在下周推出GPT-4，會(huì)是多模態(tài)模型。這將提供完全不同的可能性，比如視頻。
多模態(tài)的出現(xiàn)，微軟（-OpenAI）會(huì)讓大模型更加全面。

值得一提的是，前幾日微軟剛發(fā)布了多模態(tài)大語言模型Kosmos-1。它可以感知一般模態(tài)、遵循指令并執(zhí)行上下文學(xué)習(xí)。

Kosmos-1可以自然地處理感知密集型任務(wù)和自然語言任務(wù)，比如視覺對(duì)話、視覺解釋、圖像字幕、簡單數(shù)學(xué)方程式、OCR等。

因此有媒體認(rèn)為，這樣一來GPT-4指向多模態(tài)似乎也并不稀奇。

除此之外，在這場論壇上，還有微軟德國的CEO Marianne Janik，全面談到了人工智能對(duì)企業(yè)創(chuàng)造性的“破壞”——目前人工智能開發(fā)和ChatGPT是“iPhone時(shí)刻”。

她談到，這并不意味著要更換工作，而是以一種跟以往不同的方式來完成重復(fù)性工作。新的職業(yè)也正在出現(xiàn)，建議企業(yè)組建內(nèi)部“能力中心”，培訓(xùn)員工使用人工智能。

網(wǎng)友：等不及了

雖然此番GPT-4發(fā)布時(shí)間有待確定，但網(wǎng)友們確實(shí)也坐不住了！

比我預(yù)想的還快。

然后已經(jīng)有人開始想想GPT-4會(huì)是什么樣的了。

事實(shí)上自ChatGPT上線以來，GPT-4早已經(jīng)是千呼萬喚了。

據(jù)當(dāng)時(shí)披露，原本GPT-4在OpenAI內(nèi)部幾乎準(zhǔn)備就緒，只待發(fā)布；結(jié)果高層突然宣布新任務(wù)：兩周后發(fā)布免費(fèi)聊天機(jī)器人應(yīng)用，代號(hào)“Chat with GPT3.5”，也就是今天見到的ChatGPT。

隨后又有爆料稱，GPT-4被曝接入微軟必應(yīng)搜索；GPT-4將有100萬億個(gè)參數(shù)。（也就是前文那個(gè)圖，不過很快被Open AI的CEO奧特曼否認(rèn)了）

現(xiàn)在至少是個(gè)微軟員工站出來說話，看來GPT-4已經(jīng)呼之欲出了。

巧的是，谷歌前兩天也發(fā)了個(gè)5620億超大模型PaLM-E。甚至連機(jī)器人都能用，在學(xué)術(shù)圈引發(fā)了不小的熱議。