《Science》公布年度十大突破,AIGC、AI for science贏麻了
剛剛,《Science》評選出 2022 年度十大科學突破。
今年為人工智能贏得一席之地的是 AI 生成內容(AIGC)和 AI 加速科學發現兩個熱門的研究方向。
藝術創作和科學發現曾被認為是人工智能難以涉足的兩個領域,因為它們需要人類的智慧和創造力。但現在,AI 已經在這兩個方向上做得很好。
2022 年 AIGC 領域研究最多的當屬文本到圖像生成模型。這類模型使用機器學習在線分析文本和圖像的配對,找到根據新文本創建新圖像的模式。
從 2021 年 OpenAI 展示 DALL·E 生成「牛油果形狀的椅子」開始,文本到圖像生成模型就進入了一個新的階段。
2022 年 4 月,OpenAI 又發布了升級版模型 DALL·E 2。DALL·E 2 建立在 CLIP 的基礎上,又使用稱為擴散(diffusion)的過程從「噪聲」中生成圖像。
DALL·E 2 可以高效地生成逼真的圖片。今年還有多種擴散模型面世,并且 Meta、谷歌等公司還發布了可以生成視頻的擴散模型。
下圖是文本到圖像生成模型 Midjourney 生成的《太空歌劇院》,39 歲游戲設計師 Jason Allen 憑借這幅 AI 生成的畫作獲得在美國科羅拉多州舉辦的藝術博覽會數字藝術類冠軍。
2022 年 AIGC 模型的發展引發人們對于 AI 創作藝術的關注和倫理思考。
另一方面,在科學、數學和編程方面 AI 模型也延續了 2021 年的進展。2021 年 《Science》的十大年度突破包括預測蛋白質結構的 AI 模型 AlphaFold。在這項工作的基礎上,研究人員現在已經使用人工智能來設計可用于疫苗、建筑材料或納米機器的全新蛋白質。
在《Science》今年 9 月發表的一篇論文中,華盛頓大學醫學院生物化學教授 David Baker 等研究者提出,AI 可以通過兩種思路從頭設計蛋白質。其中一種被稱為「幻想」,這種技術從隨機序列開始,然后將它們突變為其他人工智能工具確信會折疊成穩定蛋白質的序列。
他們設計了一種用以生成氨基酸序列的新算法「ProteinMPNN」,可以在 1 秒鐘內開始運算,比此前最頂尖軟件的速度還要快 200 多倍。
與此同時,DeepMind 發布了一個名為 ??AlphaTensor?? 的工具。它發現了人類數學家幾十年來所忽視的捷徑,可以為矩陣乘法 block 設計更高效的算法。矩陣乘法是計算機圖形學、數字通信、神經網絡訓練和科學計算等很多計算任務的核心組成部分,AlphaTensor 發現的算法可以顯著提升這些領域的計算效率。
據 DeepMind 介紹,AlphaTensor 建立在 AlphaZero 的基礎上。這項工作展示了 AlphaZero 從用于游戲到首次用于解決數學難題的一次轉變。
雖然 AlphaTensor 誕生之初只專注于矩陣乘法這一特定問題,但 DeepMind 表示希望能夠啟發更多的人使用 AI 來指導其他基礎計算任務的算法發現。并且,DeepMind 的研究還表明,AlphaZero 這種強大的算法遠遠超出了傳統游戲的領域,可以幫助解決數學領域的開放問題。
DeepMind 還推出了 AlphaCode,這是一個可以編程解決數字問題的系統,比如計算多少個給定長度的二進制字符串沒有連續的零。AlphaCode 使用一個根據以前的程序及其描述訓練出來的模型來生成許多候選程序,然后挑選出最具前景的。
上周,AlphaCode 這項研究在《Science》上正式發表。
與人類程序員相比,AlphaCode 的成績處于中等水平。DeepMind 的研究者將 AlphaCode 放在編程競賽平臺 Codeforces 挑戰中進行了測試,AlphaCode 針對 Codeforces 網站上 5000 名用戶解決的 10 項挑戰進行了測試,總體排名位于前 54.3%,擊敗了 46% 的參賽者 。
雖然未能贏得比賽,但這個結果已代表了人工智能解決問題能力的實質性飛躍,證明了深度學習模型在需要批判性思維的任務中的潛力。
DeepMind 指出,AlphaCode 目前的技能組合目前僅適用于競賽性質的編程領域,但它的能力為創建未來工具打開了新的大門,這些工具使編程變得更加容易,并且有朝一日完全自動化。
除了關于這些壯舉是否算作真正的創造力的辯論之外,它們還引起了現實與道德上的困境。一些觀察家擔心,這些人工打造程序員的和藝術家會侵犯版權、延續刻板印象、傳播錯誤信息或削減工作崗位。但毫無疑問的是,人類將利用這些工具來擴展自身的創造力,就像過去利用織布機、照相機和其他曾經令人不安的發明那般。