算法捉蟲:深度學習和計算機視覺改變昆蟲學
導語
計算機算法不僅可以幫助我們檢查軟件程序中的bug,也能助力科學家去尋找自然界中的真·bug。今年發表于 PNAS 的一篇論文,提出了基于傳感器的大規模昆蟲檢測,利用深度學習技術,獲得全面的生態信息大數據。
生物種群進入高速滅跡新時期
世界走到了某個緊要的關頭:許許多多的征兆似乎在預示著世界末日的來臨。以生物學為例,人類現在所經歷的第六次生物大滅絕,可能等同于6500萬年前的白堊紀生物滅絕事件。在那次事件中,恐龍——地球上曾經的主宰——沉入地下,成為了巖層中的化石。無論是科學家還是博物愛好者都能輕而易舉查閱到大量的鳥類、哺乳類和兩棲動物的滅絕記錄,在那一時期,地球上大約有80%的物種消失了。
現在,有眾多研究報告表明,昆蟲在消失。三年前,德國克雷菲爾德昆蟲學會發布的報告總結并指出,30 年來,飛行類昆蟲的數量減少了75%。隨后,一項發表于 Nature [1]上關于昆蟲總生物量和種群數量的測量研究也證實了這一點。
昆蟲在世界中發揮了重要作用
然而,相較于其他表明昆蟲種群數量依舊穩定的研究,這樣的結論也許確實聳人。研究人員一直在思考,是否學界夸大了昆蟲滅絕的影響。考慮到昆蟲對我們人類生存環境的重要影響,在作出相應的結論前,研究人員應當擁有準確詳細的數據。昆蟲類似能自動加油的微型汽車。昆蟲的身體結構比人類發明出的任何設施都要先進。昆蟲可以執行不計其數的任務,從瓜果蔬菜到野草花粉、從枯枝爛葉到糞便腐肉,昆蟲的身影可以說無處不在,它們凈化了土壤與水體,并促進了在營養物質在自然界中的循環。
蜜蜂提供授粉(圖源pixabay)
所以說,昆蟲為生態系統中其他不計其數的物種提供了食物來源,昆蟲數量減少所造成的影響可能是無法想象的。雖然現代科技發展迅猛,而且研究人員對昆蟲的探索手段并沒有顯著提高。科研人員仍然采用緩慢低效的勞動力密集型手段來對昆蟲進行跟蹤。如果他們能借助新的科技去完成這項古老的工作,獲得昆蟲更詳細的信息,相應問題也就更容易解決。
人工智能帶來希望
不過,近十年來,深度學習等技術的發展為昆蟲學這一古老的學科帶來了新的機遇。基于深度學習算法的圖像處理技術和計算機視覺技術正在替代傳統的人工觀測方法。
在農業中,昆蟲通常被視為害蟲,因此已有的昆蟲檢測技術往往是通過檢測昆蟲的行為,開發更加高效的殺蟲劑從而防治蟲害。不過,科研人員可以基于同樣的技術原理改變其用途。近期的研究就表明,利用攝像機、雷達與麥克風等傳感設備可以獲得的數據集規模比傳統的觀測手段要高出多個數量級。因此深度學習算法就成為了一個提取處理數據的重要工具。
這一方法已經在單一物種的檢測中得到了應用。例如,科研人員可以把一種以橄欖樹為食的昆蟲引誘至陷阱中,然后自動拍照并利用遠程服務器中的算法進行分析。相應的識別算法在人臉識別問題中已經超越了人類的能力,在昆蟲領域自然也不例外。深度神經網絡已經可以識別并統計昆蟲的數量,此外也能獲得更加豐富的內容,如蜜蜂和其他訪花昆蟲的季節性動態信息。
Høye 和他的同事們[2]就專注于幾項潛在的革命性研究應用。首先,為了更好地了解全球昆蟲減少的嚴重程度,世界各國的研究機構都可以開始采用基于圖像識別技術進行昆蟲豐度和多樣性監測。類似乎拍照識花之類的手機應用,人們也可以采用同樣的思路去識別單只昆蟲[3,4]。雖然這種方法并不太適用于嚴肅系統化的生態檢測與科研任務,但也是一個值得期待的方向。能生成高時空分辨率圖像的延時相機也在研發當中,這類技術可以應用于對田野、森林等區域中特定昆蟲物種的檢測。
深度學習進一步助力昆蟲研究
這些新技術也為了解物種之間的相互作用帶來了契機。物種之間的相互作用對于整個生態系統而言至關重要。但因其出現的時間不確定且概率較低,因此難以人工檢測并進行記錄。然而,高速圖像檢測技術就可以解決這一問題。諸如,昆蟲造訪花朵與動物采食青草、落葉植物等過程都可以通過固定的攝像機機位對生物的完整生長過程進行記錄。延時相機和深度學習技術在記錄植物-昆蟲相互作用方面的能力也已經被得到了驗證。
物種間具有復雜互作關系 Nature (S. Seibold et al. Nature 574, 671–674; 2019)
一個更為宏大的目標就是利用機器學習圖像識別分類的技術來推動分類學自身的發展。在近期的一項研究中,通過對約65000張博物館標本甲蟲圖像的數據進行學習,識別系統達到了75%的成功率。雖然,識別系統的成功率會改進提升,但分類學家也不必擔心“人工智能搶飯碗”等失業問題。新的技術可以應用于常規的識別鑒定工作,以減輕科研工作者的工作負擔,讓專業人士的精力能更多的分配到標本研究的工作中。