我的畫拿獎了,但是用AI畫的
這是一副剛剛獲得獲得了美國科羅拉多州博覽會舉辦的藝術比賽一等獎的作品《太空歌劇院》。而該畫的創作者杰森艾倫自曝該作品是其用AI繪畫 App“Midjourney”創作產生的。
《太空歌劇院》的出現,讓人們再次將目光放在AI與藝術的融合上。伴隨著技術和軟件能力的提升,“人人都可以畫畫”的時代已經到來了。百度文心一格相關負責人表示,計算機與藝術創作的融合,具有很大的想象空間,AI將對藝術創新起到正向促進作用。
每個普通人都可以通過文字來描述自己的想法,然后通過機器來實現創作,人工智能在藝術領域的學習與創作能力正以蓬勃之勢不斷刷新我們的認知,一個新的藝術類別也逐漸興起。
藝術因為AI消亡?
“我們正在目睹藝術在眼前消亡。”這是諸多網友在得知《太空歌劇院》的創作過程后最直觀的看法。他們認為Allen使用AI生成圖像完全是在作弊,但Allen自己卻不以為然。
他介紹了這幅作品的創作過程耗時一個月,不停地修改輸入關鍵詞,給MidJourney提交盡可能精確具體的詞語,創作了100多張作品后,挑選出了三張自己認為最滿意的,用GipaPixel AI將圖片清晰化,又用Photoshop進行多次調整,最后才打印在畫布上。
這并不是AI作品第一次在正式的藝術舞臺上亮相,2018年10月,藝術品拍賣行佳士得曾以約一萬美元的價格成交了一幅由AI生成的油畫《Edmond Belamy的肖像》。創作者讓AI模型分析了15000幅14至20世紀的油畫后,仿出了一幅風格類似的作品。
佳士得對作品的形容是:在藝術與人工智能之間交互的實驗。意味著,這幅拍賣作品的核心價值并不在畫作本身,人們關注更多的是當時看來前所未有的生產方式。這足以說明,AI技術生成的圖片不是既有圖片的拼湊,而是類似人類經過長期繪畫訓練后的“再創作”。
盡管人工智能作品充滿了沖擊力和視覺張力,但和幾乎所有其他的深度學習模型一樣,在理解知識、推理、邏輯方面做得都不夠好。一個已經被廣泛注意到的問題,是人工智能經常會生成奇形怪狀的手。
這就要先提到AI繪圖的原理。據百度文心一格相關負責人介紹,AI從海量圖文對應的數據中學習到了“語言描述”與“藝術畫面”的關聯,以隨機化的起點開始,不斷修正畫作,最終形成在審美上與人類經驗與知識高度一致的成品。
人的一只手有超過 20 個關節,是人類身體上形狀最豐富的結構之一。在大部分用來訓練的圖片中,手部經常不是最核心的部位,不同角度、不同距離、手不同勢、還有被陰影和其他物體遮擋等現象,就會讓AI在手的表現上出現問題。
從技術角度來看,需要提高的主要是兩個方面,包括生成的可控性和細節描述能力。目前AI對于數量、邏輯、關系、多圖關聯等問題暫無有效的解決方案。例如要求生成2個蘋果,左邊是紅色,右邊是綠色。雖然這邊的關系并不負責,但是在通常情況下,模型并不能穩定的生成正確的結果。
另一方面,AI對于更加復雜的、有規律性細節的描述能力有待提升。例如一棟居民樓的窗戶應該具有多種形態,開著的、關上的、有人在窗邊看風景、有晾在陽臺上的衣服等等……但目前的AI繪畫尚未具備這樣的能力,同理,手部繪畫也是這樣的問題。
“大力出奇跡”的大模型
人工智能上一次驚艷互聯網還是2020年。
這一年,由OpenAI公司開發的GPT-3橫空出世。有開發者給GPT-3 做了圖靈測試,發現GPT-3對答如流,正常得不像個機器。而最近又一次驚艷互聯網的ChatGPT同樣出自這家公司。
相比GPT-3,ChatGPT的主要提升點在于記憶能力。ChatGPT可以儲存對話信息,延續上下文,從而實現連續對話,這在對話場景中至關重要,極大地提升了對話交互模式下的用戶體驗。
ChatGPT的背后離不開大模型、大數據、大算力。根據國盛證券研報數據顯示,ChatGPT技術底座使用的是微調后的GPT-3.5系列模型,有著多達1750億個模型參數,OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。GPT-3.5在微軟Azure AI超算基礎設施上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。
而為AI繪畫提供優質應用體驗的關鍵技術是大模型。2021年3月OpenAI發布人工智能繪畫產品DALL·E,現已升級到DALL·E 2;谷歌、Meta、百度、阿里等互聯網巨頭也推出了支持生成內容的AI大模型以及對應產品。
百度基于文心大模型推出了AI藝術與輔助創作平臺文心一格,是百度依托于飛槳、文心大模型持續的技術創新,在“AI作圖”方面發布的產品和技術工具。定位為面向有設計需求和創意的人群,基于文心大模型智能生成多樣化AI創意圖片,輔助創意設計,打破創意瓶頸。
文心一格是基于文心大模型的文生圖系統實現的產品化創新。在文心一格官網,用戶只需輸入自己的創想文字,并選擇期望的畫作風格,即可快速獲取由一格生成的相應畫作。文心一格既能生產恢弘絢麗的藝術畫,也能生產創意腦洞的超寫實圖,兼具中國特色,支持國風、動漫、插畫、油畫等十余種繪畫風格和不同畫幅的選擇。
百度文心大模型已摸索出一條大模型產業化路徑。百度CTO王海峰指出,具有算法、算力和數據綜合優勢的企業,可以將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務,從而形成一條大模型產業化路徑。
突破繪畫的邊界
1839年,照相機問世,給彼時純手工的繪畫帶來了巨大的沖擊。法國知名藝術家德拉洛奇也曾發出悲嘆:“繪畫已死!”但隨著相機普及,攝影作品作為一種藝術品的觀念,也逐漸為大眾所接受。
19世紀英國著名的“盧德運動”中,大量英國工人闖進工廠破壞紡織機等機器,因為他們認為機器搶走了他們的工作。
但最終,繪畫沒有死,藝術出現了新的表現形式,機器幫助社會創造了更多的生產力。經濟學家凱恩斯曾分析,新技術的出現會導致技術性失業。為了避免被淘汰,人們總是不得不提升應用各類技術的能力。
從目前的實踐來看,AI繪畫帶來了新的創作方式,大幅提高了繪畫效率。無論是對畫師、設計師、藝術家等專業視覺內容創作者還是媒體、作者等文字內容創作者來說,AI作畫無疑是提供創意思路,輔助進行藝術創作,既提升效率也提升質量。
對于未來,技術和應用都還將快速發展。從技術上來看,未來AI不止可以作畫,還可以基于文字內容一鍵生成AI原創短視頻,并自動配上字幕、語音、音樂等等。例如,2022萬象·百度移動生態大會上,由百度APP推出的數字人度曉曉作詞作曲演唱的《啟航星》,是首支全AIGC生成的MV,其中畫面部分由文心一格根據歌詞自動生成。應用上,AI作畫將不斷的融入到各種內容創作場景,除了常見的插畫師和藝術設計領域,未來在移動內容生產、游戲、工業設計、AI教育等場景都會有越來越廣泛的應用。
對于卓越的藝術家來說,他們不可能會被AI替代。但普通的藝術家為了更具競爭力,很可能需要學習利用AI進行藝術創作,就好像現在的畫師都要掌握數字繪圖軟件一樣,先進的工具最終會成為必要的生產資料。
就像《太空歌劇院》的創作者對于爭議回應時說的那樣:“我不會為此道歉,我沒有違反任何規則,我贏了。”