馬斯克點贊SpaceX天才實習生:課余用AI破解上古卷軸,獲Nature頭版關注
Nature官網頭版,最新刊發的是最新考古成果,轟動全球的成果——
時隔2000年,上古卷軸(赫庫蘭尼姆卷軸)的神秘面紗,終于被揭開!
而且,這項研究還是AI完成的,背后的背后則是一名年僅21歲的天才少年,馬斯克點贊的SpaceX實習生。
不同于一般的密碼破解,分析這份卷軸之難,無異于解讀一本“無字天書”——
因為在公元79年,這組卷軸在一次火山爆發中被燒成了碳,1752年才被挖掘出土。只要稍有不慎,脆弱的卷軸就會分分鐘變成殘片,想要通過物理方式展開,難如登天。
直到今時今日,三名大學生,終于借助AI的力量,成功破譯了其中的段落,打開了全新的考古研究范式。
他們通過給卷軸拍攝CT影像并借助機器學習技術分割識別,把卷軸中的2000余個字符,揭示開來。
這一消息也迅速引發了全球轟動,目前為止,瀏覽量已經超過了1500萬次,轉評贊接近6萬。
馬斯克也給三人團隊點了贊,表示這實在是泰褲辣。
DeepMind的創始人Demis也大為贊嘆,還表示自己已經迫不及待地想要讀一讀這段神秘的文字了。
那么,這份神秘的卷軸是如何一步步被破譯的呢?
不用打開,也能破譯內容
交出這份成果的,是三名學生組成的隊伍,他們分別是:
- Youssef Nader,來自埃及,在德國柏林的一家院校攻讀博士
- Luke Farritor,SpaceX 實習生,在內布拉斯加大學林肯分校計算機專業讀本科
- Julian Schilliger,瑞士蘇黎世聯邦理工學院機器人專業碩士
想要在沒有損傷的前提下破譯這團被燒成碳的卷軸,打開看幾乎是不可能的。
1865年,有人嘗試用物理方式把卷軸打開,結果以失敗告終,一部分卷軸直接成為了碎片。
此后近兩百年,便再也沒有人敢嘗試物理展開了。
直到2019年,肯塔基大學EduceLab的Brent Seales教授通過粒子加速器給卷軸拍攝了分辨率高達4μm的三維CT影像。
Seales教授的博士生Stephen Parsons長期致力于使用機器學習模型檢測CT圖像中的墨水,他利用已經展開的部分帶有可見墨水的卷軸碎片,建立了一個ground-truth數據集。
網友們對此事展開了熱烈討論,并通過一場播客中傳到了Luke的耳朵。
這引起了他極大興趣,開始利用空余時間訓練機器學習模型,以便對墨跡進行分析。
最終,Luke的模型成功分析出了卷軸中肉眼不可見的符號,并發現了一個完整的單詞。
這個詞是希臘語的“ΠΟΡΦΥΡΑ?”(小寫:πορφυ?ρ?α??,拉丁轉寫:porphyras),意思與“紫色”相關。
這一發現,讓他成為歷史上第一個從赫庫蘭尼姆古卷內部讀出整個單詞的人。
Youssef是第二個破譯出這個單詞的人,他采用了不同的方法,但得到了內容相同且更為清晰的結果。
也正是看到Youssef提交的結果之后,專家們對Luke的發現,更加確認了。
Julian則參與研發了EduceLab的3D模型分割工具Volume Cartographer。
Volume Cartographer將三維CT圖像沿卷軸展開,并映射到了二維平面,為Luke和Youssef的破譯工作奠定了基礎。
此后,Julian又提出了新的分割方法ThaumatoAnakalyptor,通過重新分割的方式對已破解區域進行了驗證,并探索了更多未知片段。
此后,為了更快破譯出更多內容,三人組成了超級團隊,最終成功解讀出了2000多個字符。
他們使用了三種不同模型架構進行了分析,之間的結果可以相互印證,墨水檢測程序代碼還直接在GitHub上做了開源。
他們分析出的這兩千多個字符,位于其中一卷的結尾,篇幅大約是該卷的5%,內容被認為與伊壁鳩魯哲學有關。伊壁鳩魯(Epicurus)是古希臘哲學家,主要關注個人的幸福和心靈的平靜,但講理性、在自然科學領域提出了原子論,對后世的倫理學和心理學發展都產生了重要影響。
而在這個卷軸的兩個連續片段中,作者提及了商品(例如食物)的可獲得性(availability)是否以及如何影響它們能帶來的快樂(pleasure)。
所以這次考古發現,實際上或許能進一步幫助了解古人對于世界的認知和探究。
一場挑戰賽,三名學生,500萬獎金
而讓這三名學生走到一起的,是一場名為“維蘇威火山”的挑戰賽。
在Stephen建立了數據集之后,硅谷企業家、GitHub前CEONat Friedman對此產生了濃厚興趣,并出資贊助了這場比賽。
主辦方于去年3月公布了評選標準,參賽者需要破譯至少4個段落,每個段落140個字符,其中至少85%的字符可恢復。
當時,專家組普遍認為一年之內有人挑戰成功的概率還不到三成,但結果卻出乎意料——
據介紹,比賽的消息發布后他們收到了許多作品,直到ddl之前幾分鐘還有團隊交出成果。
經過為期一個月的審查,這份包含了2000個字符的文本,被認定破譯成功。
這三位獲獎者將瓜分70萬美元的獎金,折合人民幣500多萬。
此外,還有三個團隊因提交的結果具有顯著可讀性,獲得了二等獎,這三個團隊將各獲得5萬美元的獎勵。
其中就包括谷歌華人工程師Shao-Qian Mah所帶領的團隊。
下一步,比賽主辦方希望在一年的時間內破譯四組卷軸的90%,后續比賽信息也將在3月份公布。
當然,這樣的挑戰賽獎金只是一方面,更重要的是展現了如何用AI解決各行各業挑戰的可能性和可行性,包括考古這樣的學科。
或許你也有所耳聞,更早之前,AI對于甲骨文的研究也開始了。你要還知道其他的項目?也歡迎分享分享~~
參考鏈接:
[1]https://scrollprize.org/grandprize。
[2]https://twitter.com/natfriedman/status/1754519304471814555。