AI用50個三角形畫出抽象版蒙娜麗莎,有股后現代的感覺了
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
現在,給AI一個短語和50個三角形,它就能創作一副極簡風格的抽象畫了。
只需輸入“a drawing of cat(一張貓的畫像)”,一只棱角分明、散發著冷酷氣息的抽象貓就生成了。

不只是這種泛泛的概念,給出特定詞匯,這個AI也能指定作畫。
比如輸入“Walt Disney World(迪士尼樂園)”,50個三角形立刻重新排布,一個風格完全不同的抽象版迪士尼城堡就出現在了眼前。

可以說是完完全全抓住了迪士尼城堡的精髓。

以上這些“大作”,其實都是進化策略 (ES)和CLIP結合后生成的效果,由谷歌大腦團隊出品。
他們讓兩個AI相互配合,根據文字提示及具體圖像,用一堆三角形創作出了一幅幅極具特色的抽象畫。
抽象后的谷歌大樓,大概長這樣:

不能說毫無關系,只能說一模一樣啊。
這回,真的有點后現代藝術的feel了。
只用三角形創作的抽象畫
從生成的效果可以看到,ES算法+CLIP其實就是把一堆隨機的三角形重新排布,通過調整它們的大小、位置、顏色,逐漸將其構建成一個與給出詞匯所吻合的圖像。

具體來看,在最初始時,ES算法會以三角形的坐標、RGBA值作為參數,在畫布上隨機給出一些三角形。
進化策略(ES)算法的原理則像進化論一樣,它可以根據給出的信息不斷優化,直到得到一個最優解。
CLIP則是OpenAI開發的一個負責給圖像重排序的模型。
它會對ES算法給出的三角形圖像與文字描述的相似度進行打分,然后將結果反饋給ES算法,ES算法就會為了提升分數而不斷迭代,最后得到一副藝術畫。

除了給出文字指令外,直接給一張圖作為初始信息,只用ES算法也能進行作畫。
這不,用50個三角形、迭代10000次后,后現代抽象版蒙娜麗莎誕生了。

如果增加更多的三角形,算法給出的效果也會更好。
在下面的對比中,當三角形數量達到200時,生成的圖像立刻增加了億點點細節。
其中達爾文和蒙娜麗莎的例子,fitness幾近達到了100%。

此外,為了實現更好的效果,研究人員還采用了ClipUp優化器。
從對比中可以看到,使用優化器后迭代1萬次后的效果比基本算法迭代56萬次后的還要好。

同時,與基于梯度的渲染方法對比,ES算法的表現也可圈可點。
渲染方法會更側重于紋理和顏色上的細化,而ES算法會更加側重于如何布局這些三角形。

那么給出文本指令生成的效果如何呢?

在“Self”、“Human”、“Walt Disney World(迪士尼樂園)”幾個案例中,算法的表現依舊很優秀。
在體現關鍵字主題精髓的情況下,隨著構圖三角形數量的增多,算法給出的結果細節也就更為豐富。
但是在“ picture of Tokyo”這個例子中,它的表現就不那么好了。
研究人員認為這是由于算法在生成陰影較深的三角形上還存在困難,所以造成了這一結果。
而且面對命題作業,算法也會盡可能給出不同的答案。
在這幾個案例的重復4次測試中,我們可以看到生成的圖像都存在明顯的區別。

Demo可試玩
其實這并不是CLIP第一次“指揮”別的AI作畫了。
此前與GAN配合,就讓圖像變成了CG藝術風。

事實上,這一次的抽象畫效果,你也可以體驗。
團隊已經將代碼開源,在Colab上也能進行試玩(鏈接已附在文末)。

這是有網友上傳的生成圖像,效果真的還不錯,你能猜出來這是誰嗎?

論文鏈接:
https://arxiv.org/abs/2109.08857
GitHub開源地址:
https://github.com/google/brain-tokyo-workshop/
試玩鏈接:
https://colab.research.google.com/drive/1DGNxs8E4cA_ZUwPQdusxDArCWj-JX5TG#scrollTo=7AkoGodQw8kr&uniqifier=4