OpenAI推出新款大模型Sora,可根據(jù)文本生成視頻
2月18日消息,據(jù)外媒報(bào)道,OpenAI推出一款名為Sora的新款A(yù)I模型,據(jù)稱(chēng)該模型可以通過(guò)快速文本提示創(chuàng)建“逼真”和“富有想象力”的60秒視頻。
OpenAI在一篇博客文章中表示,Sora能夠根據(jù)文本指令生成長(zhǎng)達(dá)60秒的視頻,并能夠提供包含多個(gè)角色、特定類(lèi)型的動(dòng)作和詳細(xì)背景細(xì)節(jié)的場(chǎng)景。
“這個(gè)模型不僅能理解用戶(hù)在提示中要求什么,還能理解這些東西在現(xiàn)實(shí)世界中是如何存在的。”博客文章說(shuō)。
OpenAI表示,計(jì)劃訓(xùn)練AI模型,使其能夠“幫助人們解決需要現(xiàn)實(shí)世界互動(dòng)的問(wèn)題”。
市場(chǎng)研究公司ABI?research的高級(jí)分析師Reece?Hayden表示,盡管“多模態(tài)模型”并不新鮮,而且文本到視頻的模型已經(jīng)存在,但OpenAI聲稱(chēng)Sora具有的長(zhǎng)度和準(zhǔn)確性使其與眾不同。
Hayden表示,這些類(lèi)型的人工智能模型可能會(huì)對(duì)數(shù)字娛樂(lè)市場(chǎng)產(chǎn)生重大影響,因?yàn)樾碌膫€(gè)性化內(nèi)容將在各個(gè)渠道上傳播。
“一個(gè)明顯的用例是電視,創(chuàng)造簡(jiǎn)短的場(chǎng)景來(lái)支持?jǐn)⑹拢盚ayden說(shuō),“雖然這種模式仍有局限性,但它顯示了市場(chǎng)的方向。”
與此同時(shí),OpenAI表示,Sora仍在開(kāi)發(fā)中,存在明顯的“弱點(diǎn)”,特別是在提示的空間細(xì)節(jié)方面。例如制作了一個(gè)視頻,視頻中有人咬了一口餅干,但之后沒(méi)有咬痕。
目前,OpenAI的信息仍然集中在安全上。該公司表示,計(jì)劃與一個(gè)專(zhuān)家團(tuán)隊(duì)合作測(cè)試最新模型,并密切關(guān)注包括錯(cuò)誤信息、仇恨內(nèi)容和偏見(jiàn)在內(nèi)的各個(gè)領(lǐng)域。該公司表示,它還在開(kāi)發(fā)幫助檢測(cè)誤導(dǎo)性信息的工具。
Sora將首先提供給被稱(chēng)為“紅隊(duì)”的網(wǎng)絡(luò)安全教授,他們可以評(píng)估產(chǎn)品的危害或風(fēng)險(xiǎn)。它還向一些視覺(jué)藝術(shù)家、設(shè)計(jì)師和電影制作人提供訪問(wèn)權(quán)限,以收集關(guān)于創(chuàng)意專(zhuān)業(yè)人士如何使用它的反饋。