車輛意圖預測中一種基于因果時間序列的域泛化方法
arXiv上2021年12月3日上傳的論文“Causal-based Time Series Domain Generalization for Vehicle Intention Prediction”,作者來自伯克利分校。
準確預測交通參與者的行為是自動駕駛車輛的基本能力。由于在動態變化的環境中導航,無論在何處以及遇到何種駕駛環境,都需要進行準確的預測。當自動駕駛車輛部署在現實世界中時,對未知域的泛化能力對預測模型至關重要。本文提出一種基于因果的時間序列域泛化(causal-based time series domain generalization,CTSDG)模型。構建一個車輛意圖預測任務的結構化因果模型,學習用于域泛化de輸入駕駛數據不變表征。進一步將遞歸潛變量 (latent variable) 模型集成到結構化因果模型中,更好地從時間序列輸入數據中捕獲時間潛在依賴性。
該文章被Neurips 2021的workshop on Distribution Shifts接收。
因果關系側重于表示數據生成過程的結構知識,允許干預和更改,有助于理解和解決當前機器學習方法的一些局限性。事實上,結合或學習環境結構化知識的機器學習模型已被證明更有效,泛化效果更好。對于駕駛員來說,在不同域的交互方式也應該處理一些不變的結構化關系,因為這樣可以快速調整駕駛技能以適應新的場景。因此,作者構建了一個用于車輛意圖預測任務的結構化因果模型(SCM),以學習輸入駕駛數據的不變表征,用于域泛化。
如圖是CTSDG的框架圖:其中觀測量顯示為陰影節點;潛量節點是透明的。有向黑邊表示因果關系;虛線雙向邊表示相關性;空心虛線箭頭表示包含關系。藍線表示推理過程,綠線表示生成過程,紅線表示遞推過程。
域(D)包含地圖屬性的不同組合,如道路拓撲、速度限制和交通規則;事件(E)表示兩個車輛交互事件相關的可觀察變量,包括初始交互狀態和交互長度等信息;駕駛員(O)表示每個駕駛員的駕駛偏好或駕駛風格相關的不可觀察變量,例如攻擊性級別和他/她是否遵守交通規則;因果特征(XC)表示駕駛員的個人行為O及其交互狀態E中衍生出的高級時間相關因果特征,使用這些特征來標記意圖;非因果特征(XNC)表示域相關特征,不僅包含域特定信息D,還包含事件E本身。例如交互事件信息,兩輛車開始相互注意時或道路協商開始時,與道路幾何和交通規則相關;輸入數據(X)是包含序貫多變量數據的車輛交互軌跡,由因果特征XC和非因果XNC特征混合構成;潛變量(Z)表示從時間序列車輛交互數據中提取出與時間相關的潛表示;標簽(Y)是車輛意圖標簽。
采用一個表征函數 q去映射輸入空間到一個潛空間,一個假設函數 映射潛空間到XC(因果)。合在一起,得到期望的意圖預測器f,而對應的預測損失寫成
XC(因果)需要滿足一個不變性條件,考慮到駕駛員意圖的不可觀測性,得到一個預測損失函數如下:
上面匹配函數需要優化,假設XC不同域的相同類輸入之間距離是受限的,可定義一個對比表征學習損失函數,最小化不同域的同類輸入距離,即
作者把Variational Recurrent Neural Networks (VRNN)集成入CTSDG 模型,這樣目標函數變成
最后的總目標函數為
如下是CTSDG的偽代碼算法:
實驗比較結果如下:
其中基準方法包括
傳統域泛化任務的方法7個
- ERM:Oracle Inequalities in Empirical Risk Minimization and Sparse Recover Problems,2011
- IRM:Invariant risk minimization, 2019
- CCSA:Unified deep supervised domain adaptation and generalization,2017
- Mixup:mixup: Beyond empirical risk minimization,2017
- DANN:Domain-adversarial training of neural networks. 2016
- C-DANN:Deep domain generalization via conditional invariant adversarial networks,2018
- VRADA:Variational recurrent adversarial deep domain adaptation,2017
行為預測任務的方法3個
- CVAE:Desire: Distant future prediction in dynamic scenes with interacting agents,2017
- GAN:Social gan Socially acceptable trajectories with generative adversarial networks,2018
- GNN:Neural relational inference for interacting systems,2018
如下表是其中實驗定義的域信息:
具體圖示如下:
本文雖然展示了提出的用于車輛意圖預測任務的域泛化方法性能,但CTSDG方法也可以直接或間接地用于軌跡預測任務。最直接的方法是將軌跡預測問題作為一組不同軌跡的分類,能夠a)確保狀態空間的預期覆蓋級別,b)消除動態不可行的軌跡,以及c)避免模式崩潰問題。此外,意圖分類的準確性在回歸任務中起著重要作用。與無條件的預測相比,目標/意圖條件軌跡預測可以改進智體聯合和單個智體的預測。條件預測也可用于規劃任務。因此,擁有一個準確域泛化的意圖/目標預測器是開發最優軌跡預測器和運動規劃器的前提。