千年一瞬,兵馬俑竟眨眼了!外國小哥用AI復(fù)原了他
?千年一瞬,他們眨眼的瞬間,仿佛歷史重演。
前不久,外國博主Panagiotis Constantinou用AI修復(fù)了秦代兵馬俑。
更令人驚艷的是,他還讓古人做出了細(xì)微的動態(tài)表情。
快看,兵馬俑在向你眨眼、微笑。
去過兵馬俑后,大家都會對這些泥塑真人古跡的感到震撼。再看用AI復(fù)原后的兵馬俑,竟變成了有血有肉的大叔。
每個兵馬俑的表情都是千奇百態(tài),幾千年過去了,我們很難想象出他們當(dāng)時的樣子。
這位外國小哥讓這些兵俑重新煥發(fā)了生機(jī),穿越千年來和你對話。
此前,B站UP主大谷也對兵馬俑進(jìn)行了修復(fù),讓其嘴巴也動了起來。
其實(shí),除了兵馬俑,Panagiotis Constantinou還對埃及帝王敵后、古希臘哲學(xué)家、英國女王等做了一系列動態(tài)修復(fù)。
接下來一起欣賞下。
穿越時空相逢
古羅馬末期聲名顯赫的首富Marcus Crassus
?
亞歷山大大帝
古埃及艷后
英國女王
......
憑借這一系列修復(fù),外國博主也爆火出圈,也引來許多人的關(guān)注。
修復(fù)技術(shù)
那么AI修復(fù)工作一般都是如何實(shí)現(xiàn)的呢?
大多都會用到這三個技術(shù):第一個是負(fù)責(zé)做補(bǔ)幀的DAIN,第二個是做分辨率擴(kuò)增的ESRGAN,第三個是上色的DeOldify。
DAIN:深度感知視頻幀插值(DAIN)模型,通過探索深度信息來顯式地檢測遮擋。該項(xiàng)目開發(fā)了一個深度感知流動投影層,優(yōu)選取樣更近的物體,以合成中間流插補(bǔ)視頻幀。
ESRGAN:ESRGAN改進(jìn)自SRGAN ,主要用來做視頻超分辨率。
與SRGAN的深層模型越來越難以訓(xùn)練相反,更深層次的 ESRGAN 模型通過簡單的訓(xùn)練就能達(dá)到卓越的性能,核心點(diǎn)在于平衡視覺質(zhì)量和峰值信噪比的網(wǎng)絡(luò)插值策略。
DeOldify:DeOldify 使用了NoGAN 進(jìn)行訓(xùn)練,NoGAN對于獲得穩(wěn)定和豐富多彩的圖像是至關(guān)重要的。
NoGAN 訓(xùn)練結(jié)合了 GAN (美妙的著色)的好處,同時消除了副作用(如視頻中的閃爍對象)。
不論是圖像還是視頻,AI能夠?qū)⑵湫迯?fù)得栩栩如生,最主要的是歸功于它強(qiáng)大的學(xué)習(xí)能力。
這里我們再簡單了解一下AI修復(fù)離不開的「靈魂GAN」。
還記得馬和斑馬相互轉(zhuǎn)換的圖像嗎?這便是GAN的應(yīng)用之一。
和其他經(jīng)典的機(jī)器學(xué)習(xí)算法相比,GAN算法最大的創(chuàng)新點(diǎn)便是它結(jié)合了生成器(Generator)和判別器(Discriminator),以二者的相互對抗進(jìn)而實(shí)現(xiàn)相互優(yōu)化,最后達(dá)到一個「勢均力敵」的狀態(tài)。
以圖像為例,判別器D經(jīng)過反復(fù)訓(xùn)練,最后希望可以準(zhǔn)確分辨出哪一個是真實(shí)的數(shù)據(jù)分布,哪一個是生成器的數(shù)據(jù)分布;同時,生成器G也不斷地訓(xùn)練,最后希望能夠以假亂真,讓判別器判斷不出到底哪個是真的圖像,哪個是假的圖像。
現(xiàn)在越來越多的技術(shù)像是AI修復(fù)、AI換臉等都離不開GAN網(wǎng)絡(luò),曾經(jīng)困擾GAN的難題,比如難以收斂等也都漸漸得到了改善,而且基于GAN也衍生出了越來越多的更優(yōu)秀的網(wǎng)絡(luò),比如CycleGAN、StackGAN等,愈加逼真、生動的圖像逐一呈現(xiàn)在大眾眼前。
現(xiàn)在大抵是「萬物皆可AI」的時代了!AI還會繼續(xù)給我們帶來何種視覺驚喜,我們拭目以待~~~?