成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

馬作的盧飛快!上海AI Lab發(fā)布首個模仿人類學習范式的自動駕駛決策框架DiLu

人工智能 智能汽車
自動駕駛技術近年來發(fā)展迅速,但目前仍然面臨著諸多挑戰(zhàn)。今天為大家分享ICLR 2024剛剛中稿的工作——DiLu。

本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

DiLu(的盧)是首個基于AI Agent范式的知識驅(qū)動自動駕駛框架,其結(jié)合了常識知識和大語言模型,通過記憶模塊以實現(xiàn)閉環(huán)自動駕駛決策制定并擁有持續(xù)進化的能力。通過不斷對環(huán)境的交互積累經(jīng)驗,自我反思糾正錯誤的決策,從而實現(xiàn)Life-long Learning。DiLu現(xiàn)已在GitHub上開源,歡迎大家體驗。

論文信息

圖片

  • 論文題目:DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models ( ICLR 2024 接收)
  • 論文發(fā)表單位:上海人工智能實驗室,華東師范大學,香港中文大學
  • 論文地址:https://arxiv.org/abs/2309.16292
  • 代碼地址:https://github.com/PJLab-ADG/DiLu

研究動機

自動駕駛技術近年來發(fā)展迅速,但目前仍然面臨著諸多挑戰(zhàn)。最主要的挑戰(zhàn)之一是數(shù)據(jù)集偏差和過擬合問題,當前的系統(tǒng)大多基于數(shù)據(jù)驅(qū)動(Data-driven)的深度學習方法,它們在標準化和簡單的駕駛場景下表現(xiàn)良好,但在復雜多變的真實世界環(huán)境中卻經(jīng)常遇到困難。同時,當前的自動駕駛系統(tǒng)在理解復雜的交通環(huán)境、預測其他車輛和行人的行為等方面還存在不足。

正如Yann LeCun 所指出的 [1]:為什么一個從未開過車的少年可以在20 小時內(nèi)學會駕駛,而當今最好的自動駕駛系統(tǒng)則需要數(shù)十億的訓練數(shù)據(jù)和數(shù)百萬次在虛擬環(huán)境中進行強化學習試驗?

這些問題的根源在于現(xiàn)有系統(tǒng)缺乏對環(huán)境深層次理解和適應性,在面對未知或復雜場景時的表現(xiàn)遠遠不及人類駕駛員。人類駕駛員能夠利用其豐富的駕駛經(jīng)驗和常識性知識,靈活地應對各種駕駛情境。這種能力源自于人類的知識驅(qū)動行為,即基于對環(huán)境的理解、經(jīng)驗的積累和邏輯推理來做出決策。這引發(fā)了我們的思考,如何將人類的這種知識驅(qū)動方式應用于自動駕駛系統(tǒng),以使其能夠不斷積累經(jīng)驗,提升其在面對復雜環(huán)境時的表現(xiàn)。

知識驅(qū)動的自動駕駛范式

基于上述動機,我們提出了知識驅(qū)動(Knowledge-driven)的自動駕駛范式。這一范式的靈感正是來源于人類的駕駛行為。當面臨新的駕駛情境時,人類駕駛員依靠積累的經(jīng)驗和常識做出決策。例如,遇到前車可能掉落貨物的情況時,人類會基于常識保持安全距離。這種基于知識的決策過程與數(shù)據(jù)驅(qū)動方法截然不同,后者依賴大量相似數(shù)據(jù)來擬合特定場景,但缺乏對環(huán)境的深入理解。

圖片

在上圖中,我們展示了這一范式的理念。圖中的駕駛智能體(Driver Agent)具有三個關鍵能力:回憶(Recall)、反思(Reflect)和推理(Reason)。這些能力使得智能體不僅能夠從記憶模塊(Memory)中提取過往經(jīng)驗,進行場景分析和決策;還能通過與環(huán)境(Environment)的不斷交互和記憶的更新,實現(xiàn)持續(xù)的進化。與傳統(tǒng)的數(shù)據(jù)驅(qū)動方法相比,知識驅(qū)動的自動駕駛范式更加注重對環(huán)境的理解推理和自我持續(xù)學習的能力。

關于知識驅(qū)動的自動駕駛更細致的介紹,請參考我們團隊的綜述:Towards Knowledge-driven Autonomous Driving (https://arxiv.org/abs/2312.04316). [2]

DiLu框架介紹

基于上述知識驅(qū)動的自動駕駛新范式,我們嘗試并實現(xiàn)了一個全新的自動駕駛框架:DiLu(的盧)。該框架通過整合利用大語言模型(LLM),實現(xiàn)基于常識的決策和持續(xù)的駕駛經(jīng)驗累積。該框架由四個核心模塊組成:環(huán)境(Environment)、推理(Reasoning)、反思(Reflection)和記憶(Memory)。下圖詳細展示了DiLu框架的工作流程和各模塊之間的交互方式,包括環(huán)境感知、推理決策生成、決策的反思評估,以及記憶的更新和累積。

圖片

推理模塊是DiLu框架中的關鍵組成部分,它利用LLM的常識知識和存儲在記憶模塊中的經(jīng)驗來進行Few-shot決策制定。具體來說,推理模塊首先從環(huán)境中獲得場景描述,然后結(jié)合記憶模塊中的相似經(jīng)驗生成決策所需Prompt。接著,這些提示被輸入到LLM中,LLM基于這些信息生成當前幀的駕駛決策,并輸入環(huán)境實現(xiàn)決策閉環(huán)。下圖展示了推理模塊的工作流程,包括場景描述的生成、記憶模塊的調(diào)用、提示的生成以及LLM的決策解碼過程。

圖片

反思模塊是DiLu框架中的另一個核心部分,它負責評估并修正推理模塊產(chǎn)生的決策。這一模塊通過分析記錄的決策序列來識別不安全或不準確的決策,并利用LLM的智能對這些錯誤決策進行修正。修正后的決策會被更新回記憶模塊,從而實現(xiàn)系統(tǒng)的持續(xù)學習和進化。下圖展示了反思模塊的工作流程,包括決策的評估、關鍵決策幀的采樣、錯誤修正和經(jīng)驗的更新過程。

圖片

實驗結(jié)果

DiLu使用Highway-env仿真環(huán)境進行閉環(huán)實驗測試。Highway-env [3] 是一個基于OpenAI Gym開發(fā)的Python環(huán)境,專為開發(fā)和測試自動駕駛系統(tǒng)的決策算法而設計,提供了一個充滿挑戰(zhàn)的多車交互路況環(huán)境。下面這個視頻展示了一次閉環(huán)實驗中,DiLu框架如何在復雜的交通情境中作出決策。視頻中,綠色的自車不僅成功地進行了變道以提升車速,還像經(jīng)驗豐富的司機一樣與前車保持了安全距離,沒有采取任何冒險的駕駛策略。同時,DiLu在每個決策節(jié)點不僅能做出準確的駕駛決策,還能展示其完整的推理過程,這一點體現(xiàn)了我們框架優(yōu)異的可解釋性。

此外,我們還進行了一系列精心設計的量化實驗,來驗證DiLu框架在自動駕駛閉環(huán)決策中的表現(xiàn)。我們將DiLu與Highway-env下現(xiàn)有的強化學習方法GRAD [4] 進行了比較。我們發(fā)現(xiàn),DiLu 僅使用記憶模塊中的 40 條經(jīng)驗就超過了強化學習方法在 600,000 個episodes訓練后的閉環(huán)表現(xiàn)。同時,DiLu在泛化能力方面也表現(xiàn)出顯著的優(yōu)勢,特別是在高密度交通環(huán)境下,DiLu展示了其出色的閉環(huán)成功率。基于數(shù)據(jù)驅(qū)動的強化學習方法相比,DiLu不僅更加聰明,而且具有更強的泛化能力。此外,我們的實驗也證實了DiLu框架能夠有效利用其記憶模塊中的經(jīng)驗,不斷地提升決策質(zhì)量和系統(tǒng)的整體性能。

圖片

總結(jié)

DiLu是首個基于AI Agent范式的知識驅(qū)動自動駕駛框架,可能也是第一個將LLM和自動駕駛決策相結(jié)合的工作。具體來說:DiLu結(jié)合了常識知識和大語言模型技術,通過記憶模塊以實現(xiàn)駕駛決策制定并擁有持續(xù)進化的能力。DiLu可以通過不斷對環(huán)境的交互積累經(jīng)驗,并通過自我反思糾正錯誤的決策,從而實現(xiàn)Life-long Learning。通過大量實驗,我們證明了DiLu框架在經(jīng)驗積累和泛化能力方面具有顯著優(yōu)勢,并可以隨著LLM的發(fā)展同步提升性能。此外,DiLu還能夠直接從真實世界數(shù)據(jù)集中獲取經(jīng)驗,這為其在實際自動駕駛系統(tǒng)中的應用提供了潛力。

原文鏈接:https://mp.weixin.qq.com/s/2sKGP7HfxVQgEMqqez-dNA

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2019-08-21 08:45:25

2023-03-30 09:57:04

2023-03-15 11:54:32

無人駕駛系統(tǒng)

2022-01-26 10:31:25

自動駕駛軟件架構(gòu)

2023-10-25 09:50:07

自動駕駛訓練

2021-12-24 10:33:35

毫末智行RNN自動駕駛

2022-08-08 13:12:04

自動駕駛決策

2023-07-17 11:27:56

2025-03-11 08:37:17

2023-09-09 13:12:14

DARPA自動駕駛汽車

2024-02-29 09:28:08

自動駕駛模型

2021-12-17 10:14:53

自動駕駛數(shù)據(jù)人工智能

2023-11-07 14:07:51

GPT-4大語言模型

2020-10-13 18:51:11

自動駕駛人工智能技術

2022-04-12 09:21:50

AIPython自動駕駛

2024-04-28 15:04:08

自動駕駛視覺

2021-04-08 20:45:09

自動駕駛AI人工智能

2019-09-19 14:10:12

人工智能物聯(lián)網(wǎng)自動駕駛

2022-10-27 10:18:25

自動駕駛
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚州av| 看一级毛片视频 | 免费一区二区三区 | 色久电影 | 狠狠操电影 | 又黄又色| 天堂成人国产精品一区 | 国产高清精品一区二区三区 | 中文字幕高清 | 日本在线精品视频 | 亚洲国产成人精品久久久国产成人一区 | 粉嫩高清一区二区三区 | 久久久国产精品 | 在线观看视频91 | 男人天堂99| 亚洲成年人免费网站 | 欧美韩一区二区三区 | 日韩伦理电影免费在线观看 | 精品国产乱码久久久久久果冻传媒 | 91免费视频 | 国产精品毛片 | 99爱在线视频 | 热99在线 | 欧美日在线| 日本三级网站在线观看 | 久久久久久久一区二区三区 | 国内精品久久久久久 | 久久国产精品一区二区三区 | wwww.xxxx免费| 中文字幕日韩在线 | 九九九久久国产免费 | 亚洲第一av | 久久久久91 | 日韩a在线 | 中国黄色毛片视频 | 欧美性久久 | 国产精品视频免费 | 人人看人人搞 | 亚洲一区二区三区四区五区午夜 | 欧美 日韩 视频 | 国产一区二区三区视频在线观看 |