18歲高中生自研 AI 狂掃 2000 億行數據,挖出150萬顆未知天體,頂刊論文+25萬美金到手!
一個高中生,給宇宙來了個“大掃除”,直接揪出150萬個以前沒人知道的“太空新鄰居”!
主角Matteo Paz(馬特奧·帕茲),帕薩迪納高中的學生。他憑著一套全新的AI算法,不僅挖出了這150萬個太空“新星”,還順帶拓展了NASA一項任務的潛力,更以獨立作者身份,在頂刊《天文學雜志》上發了篇硬核論文。
就這操作,Paz直接在“再生元科學天才獎”中拔得頭籌,斬獲25萬美元大獎!
一、天才的火花與“點燈人”導師
這帕茲小哥,還在上小學的時候,他老媽就帶他去加州理工聽公共的“觀星講座”,那會兒,宇宙的種子就在他心里發了芽。
到了2022年夏天,他直接殺到加州理工校園,參加了由天文系教授安德魯·霍華德(Andrew Howard)領銜的“加州理工行星發現者學院”,猛補天文和相關的計算機科學。
2023年,他又報名了加州理工為期六周的“夏季研究連線”項目。該項目是另一個由教學、學習與推廣中心(Center for Teaching, Learning, and Outreach)運營的神仙項目,專門把本地高中生跟校園實驗室的導師們“配對”。
這時候,帕茲的“貴人”出現了:天文學家、IPAC高級科學家戴維·柯克帕特里克(Davy Kirkpatrick,下文統稱柯老師)。這位柯老師,在過去的五個夏天里,除了帶本科生、公民科學家和訪問研究生學者,還堅持指導高中生。
帕茲提起導師,那是贊不絕口:“能遇到柯老師,我真是太幸運了。我記得第一次跟他聊,我就說我想整個大活兒,搞一篇論文出來。他非但沒勸退我,反而說:‘行啊,那咱聊聊這個?!?他給了我一個毫無束縛的學習體驗。”
而柯老師自己,也是在良師的指引下才走上天文學之路的。他成長于田納西州的一個農業社區,是他的九年級化學和物理老師點燃了他的天文學夢想。當時,柯老師的老師告訴他和他的母親,他有潛力,并指導他該如何選課為大學做準備。
柯老師說:“我想把這種指導傳承下去,希望能幫到更多的人。如果我看到他們的潛力,我會確保他們能充分發揮出來,我會盡我所能去幫助他們?!?這 mentorship 的傳承,簡直了!
二、NEOWISE的“數據金礦”與導師最初的“小目標”
圖注:NEOWISE,近地小行星紅外廣域巡天探測器
柯老師心里一直惦記著一個叫NEOWISE(近地天體廣域紅外巡天探測器)的紅外望遠鏡。這臺望遠鏡雖然現在已經“退休”了,但它在過去十多年里,可是兢兢業業地掃描了整個天空,搜尋小行星和其他近地天體。
在它忙著追蹤小行星的時候,其實也探測到了其他更遙遠宇宙天體的熱量變化——那些劇烈閃耀、規律脈動或者被遮擋時亮度變暗的天體。天文學家管這些叫“變源”(variable objects),比如類星體、爆發的恒星、互相掩食的雙星等等,都是些“神出鬼沒”的家伙。
但問題來了,這些關于變源的數據,之前一直沒被好好利用。如果NEOWISE團隊能把這些變源識別出來,整理成一個目錄共享給天文界,那將為了解這些宇宙實體如何隨時間演變提供寶貴的線索。
柯老師回憶道:“那時候,我們那個記錄了十多年來每一次探測的表格,數據量已經快接近2000億行了!” 我的天,2000億行!手動翻?那不得翻到地老天荒?
“所以我當時給暑期項目的想法是,先挑一小塊天空區域,看看能不能手動找到一些變星。然后我們可以把這些發現展示給天文界,說:‘瞧,這是我們手動發現的新東西;你們想象一下這個數據集里還藏著多大的潛力!’”
三、高中生的“AI外掛”:從“大海撈針”到“宇宙級掃描”
圖注:Matteo Paz 在 2023 年的一次研討會上介紹了他項目的研究初期工作。照片:Kitt
于是,這個事兒就交給了帕茲。
帕茲在學校選修的一門整合了編程、理論計算機科學和形式數學的課程,早就深諳AI之道。
帕茲心里門兒清:AI訓練,最喜歡的就是像柯老師給他的這種量大管飽、還井井有條的數據集。而且,他編程所需的大學高階數學知識,在帕薩迪納聯合學區的數學學院(Math Academy)里啃完了。
帕茲開始開發一種機器學習技術,目標是分析整個NEOWISE數據集,并標記出潛在的變源。就在那短短的六周里,他的AI模型初稿就搞出來了,而且效果初顯。期間,他不斷跟柯老師請教,學習相關的天文和天體物理知識。
“每次和柯老師開會,都是10%的工作,剩下90%的時間我倆就是瞎聊,”帕茲笑著說?!澳苡袀€人這樣一起聊科學,感覺超酷的?!?/p>
柯老師還把他引薦給了加州理工的天文學家舒巴內·赫馬蒂(Shoubaneh Hemmati)、丹尼爾·馬斯特斯(Daniel Masters)、阿希什·馬哈巴爾(Ashish Mahabal)和馬修·格雷厄姆(Matthew Graham)。這些大牛們在天文機器學習技術以及短時標、長時標變源研究方面,都給了帕茲不少專業指導。
現在,帕茲已經把他的AI模型打磨得爐火純青,處理了NEOWISE觀測到的所有原始數據,并對結果進行了分析。這個被訓練來探測望遠鏡紅外測量中微小差異的算法,在數據中標記并分類了150萬個潛在的新天體!師徒二人計劃在2025年,把NEOWISE數據中亮度變化顯著的天體的完整目錄發表出來。
四、“不務正業”的AI與導師的“人生高光”
你以為這AI只能看星星?那格局就小了。
帕茲說:“我實現的這個模型,不僅能用于天文學的其他時域研究,理論上還能用于任何以時間序列格式出現的數據。我能預見到它在(股市)圖表分析方面的應用潛力,因為那些信息也是時間序列,周期性成分可能至關重要。你甚至可以用它來研究大氣效應,比如污染,其中季節性和晝夜循環就扮演著重要角色。”
帕茲在科學獎上的成功,也讓柯老師對“為人師表”有了新的感悟:“當他們宣布馬特奧是科學競賽的冠軍時,那是我人生中經歷過的最激動人心的時刻。我自己以前也獲過獎,那當然很刺激,但是當你幫助別人發揮了他們的潛力,并因此得到認可時,那種感覺太美妙了?!?/p>
圖片
2025 年再生元科學人才搜索一等獎得主馬特奧·帕茲手持他的獎杯。照片:科學協會
柯老師補充道:“我們能多大程度上發掘本地社區里那些真正聰明的年輕人,指導他們,確保他們的潛力不被埋沒和流失,我們整個社會就會變得更好。”
現在,帕茲一邊完成他的高中學業,一邊已經是加州理工的正式員工了。他在IPAC為柯克帕特里克工作,參與管理、處理、存檔和分析來自NEOWISE以及NASA和NSF支持的其他幾個空間任務的數據。這可是帕茲小哥人生第一份帶薪工作!