達摩院創新網絡輕量化方法,助力小蠻驢無人車以1/3算力實現工控機級智能
7月23日消息,達摩院自動駕駛實驗室提出一種高性能網絡輕量化方法“動態寬度可變網絡”,解決了以往算法硬件效率低下的問題,在ImageNet數據集上達成2到4倍的理論加速和1.62倍實際加速,以最高5.9%的精度優勢超越業界最優方法。該模型將應用于達摩院的“小蠻驢”無人車,也適用于各類有模型輕量化需求的嵌入式設備。
深度學習雖好,但很難部署到嵌入式設備上。深度學習模型對硬件的算力和內存有很高要求,而嵌入式設備往往算力有限,因此,模型輕量化是業界重要的應用研究內容。
以達摩院研發的L4級無人車小蠻驢為例,早期demo階段的無人車使用工控機執行所有的自動駕駛計算任務,2020年正式發布的小蠻驢則改用達摩院自研的高性能、低功耗、低成本嵌入式異構計算單元,后者需以1/3算力實現工控機級別的智能水平。為此,達摩院持續進行軟硬件協同優化設計,包括探索模型輕量化方法。
神經網絡剪枝(pruning)是模型輕量化方法之一,它能減少網絡參數、降低存儲要求、提高計算速度。但既有算法存在瓶頸問題,算法模型與硬件計算不兼容,理論分析與實際加速之間存在很大差距,需要犧牲相當的計算精度和時延,這在自動駕駛應用中是不可接受的。
圖說:動態寬度可變網絡通過學習一個寬度可變超網絡和一個動態門控機制來實現不同樣本的動態路由
達摩院自動駕駛團隊提出了“動態寬度可變網絡”(Dynamic Slimmable Network,DS-Net)算法,在測試時,根據不同輸入,預測性地調整網絡濾波器數量,既不影響計算精度,還解決了以往算法中硬件效率低下和計算浪費的問題。
濾波器是圖像處理任務中的概念,主要作用是提取對象特征作為圖像識別的特征模式。主流算法通常會激活所有濾波器,最大限度壓榨硬件算力。達摩院模型把剪枝視作動態過程,根據計算任務動態調整濾波器的激活數量。比如,無人車在行駛中感知到行人、汽車等簡單場景,只需easy模式;如果遇到“一輛卡車拖著一棵大樹”的復雜場景,則啟用hard模式,激活更多濾波器。
在ImageNet上,對于ResNet和MobileNet,該方法達成了2到4倍的理論加速和1.62倍的實際加速,超越現有的剪枝、網絡搜索和動態網絡壓縮方法,并以最高5.9%的精度優勢超越了SOTA(state-of-the-art)方法Universally Slimmable Network。
達摩院自動駕駛實驗室工程師王兵介紹,該方法目前正在適配小蠻驢無人車。由于并非針對特定的硬件設計,算法通用性高,適用于各類有模型輕量化需求的嵌入式設備。
據悉,小蠻驢無人車現已量產投用,未來一年預計將有1000輛車進入全國的高校和社區,開展末端配送服務。
圖說:動態寬度可變網絡成功加速ResNet-50和MobileNetV1,減少2到4倍的計算量,實現1.17倍、1.62倍的實際加速;以最高5.9%的精度優勢超越了Universally Slimmable Network