英偉達發(fā)布天氣模型CorrDiff,預測效率大漲
在全球極端天氣事件愈發(fā)頻繁的當下,從暴雨洪澇引發(fā)的城市內澇,到颶風肆虐造成的巨大破壞,精準的氣象預測成為了保障社會安全與經濟穩(wěn)定發(fā)展的關鍵環(huán)節(jié),也是AI應用的重要領域之一。
所以,英偉達的研究人員發(fā)布了最新天氣預測模型CorrDiff,能將分辨率為25公里的大氣數(shù)據(jù)細化至2公里,大幅提升了氣象預測的精度,并且能預測輸入數(shù)據(jù)中未包含的相關變量,例如,雷達反射率,這對于判斷降雨位置和強度極為關鍵。
此外,相比傳統(tǒng)使用CPU進行的高分辨率數(shù)值天氣模式相比,CorrDiff的能源效率提高了10000倍,預測效率提升500倍。
CorrDiff模型的核心之一是擴散模型,通過得分匹配的概念學習隨機微分方程整個過程包括前向和后向兩個相互配合的過程。
在前向過程中,噪聲會逐漸添加到目標數(shù)據(jù)中。隨著噪聲的不斷增加,信號會逐漸被噪聲淹沒,最終變得與噪聲難以區(qū)分。這一過程看似讓數(shù)據(jù)變得更加混亂,但實際上是為了模擬數(shù)據(jù)在真實環(huán)境中的不確定性和變化性,為后續(xù)的反向過程提供多樣化的起點。
后向過程則是利用專門的神經網絡對添加噪聲后的樣本進行去噪。在去噪過程中,神經網絡會根據(jù)所學的隨機微分方程,逐步去除噪聲,使樣本逐漸恢復到接近原始目標數(shù)據(jù)的狀態(tài)。
這個過程有點類似在迷霧中尋找正確的道路,神經網絡通過不斷地學習和調整,引導樣本朝著準確表示原始數(shù)據(jù)的方向迭代優(yōu)化。通過多次這樣的前向和后向過程,模型能夠逐漸生成高質量的預測數(shù)據(jù)。
此外,CorrDiff還受物理啟發(fā)的兩步式“校正擴散”,可同時實現(xiàn)多個變量在低分辨率和高分辨率氣象數(shù)據(jù)之間的高保真映射,并進行新的通道合成。
第一步是回歸,使用UNet進行預測,目的是近似條件均值。這一步就像是為后續(xù)的精確預測搭建了一個基礎框架,它利用低分辨率的輸入數(shù)據(jù),通過UNet強大的特征提取和映射能力,初步預測出高分辨率數(shù)據(jù)的大致形態(tài),為后續(xù)的精細化調整提供一個可靠的起始點。
第二步是生成,利用擴散模型進行校正。在這一步中,基于第一步得到的結果,擴散模型進一步對數(shù)據(jù)進行隨機校正。它通過學習隨機微分方程,在噪聲逐漸添加和去除的過程中,不斷優(yōu)化預測結果,從而生成更加精細的細節(jié),使最終的預測數(shù)據(jù)更接近真實的高分辨率數(shù)據(jù)分布。
這種將預測過程分解為均值預測和隨機校正的方式,類似于流體動力學和氣候數(shù)據(jù)分析中常用的將物理變量分解為均值和擾動的方法,有效降低了學習高分辨率數(shù)據(jù)分布的難度。
訓練數(shù)據(jù)方面,CorrDiff使用了來自25公里分辨率的全球再分析數(shù)據(jù)或氣象預報模型,如ERA5再分析數(shù)據(jù)。這些數(shù)據(jù)提供了大尺度的氣象背景信息,為模型的預測提供了基礎框架。
而目標數(shù)據(jù)是基于天氣研究和預報(WRF)物理模擬器生成的高分辨率數(shù)據(jù),分辨率達到2公里,比輸入數(shù)據(jù)高出12.5倍。WRF模型通過動力降尺度的方式,結合地面降水雷達和其他傳感器的數(shù)據(jù)同化,能夠提供較為準確的區(qū)域千米級大氣狀態(tài)估計,為CorrDiff模型的訓練提供了高質量的參考標準。
為了評估CorrDiff的性能,研究人員在多個氣象基準上進行了綜合測試。結果顯示,CorrDiff模型在各項指標上表現(xiàn)出色。以雷達反射率預測為例,CorrDiff模型的CRPS得分為1.90,MAE得分為2.54;UNet的MAE為2.51,RF的MAE為3.56,ERA5由于沒有雷達反射率數(shù)據(jù)未參與此項對比。
在2米溫度、10米東向風速和10米北向風速的預測中,CorrDiff模型同樣展現(xiàn)出較高的技能水平,其CRPS得分均低于其他基線模型,MAE得分也與表現(xiàn)較好的UNet相當或更優(yōu)。
本文轉自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)
