成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

新聞 深度學習
以深度學習為代表的人工智能技術,在計算機視覺、語音識別、自然語言處理等方向上已經取得了巨大進展,在我們生活中的多個領域得到了廣泛的應用并發揮了極其關鍵的作用。

 [[424811]]

北京航空航天大學、商湯科技、京東探索研究院等

來自北航、商湯科技和京東探索研究院等機構的研究者提出了第一個在大規模數據集 ImageNet 上面向模型結構和訓練技巧且針對多種噪音類型的模型魯棒性評測基準——RobustART。該 benchmark 全面評測了 44 種經典的手工設計和 1200 種 NAS 采樣得到的模型架構以及 10 余種模型訓練技巧對于魯棒性的影響。

以深度學習為代表的人工智能技術,在計算機視覺、語音識別、自然語言處理等方向上已經取得了巨大進展,在我們生活中的多個領域得到了廣泛的應用并發揮了極其關鍵的作用。然而,由于現實應用場景的開放性,以大數據訓練和經驗性規則為基礎的傳統人工智能(如深度學習)方法面臨著輸入樣本含有噪音的挑戰,如:自然噪音、對抗噪音等。這些微小的噪音對于深度學習模型的魯棒性和安全性產生了很大的挑戰,其對于社會穩定甚至是公共安全都可能產生極大的影響。

哪種模型對于噪音更加魯棒?哪些模型架構和組件對于噪音有更強的抵御能力?對于這些問題的研究能夠幫助我們更好地認識和理解模型魯棒性的本質,從而幫助研究人員進行更加魯棒的模型架構設計。進一步,這對于推進工業級魯棒模型的評測和落地應用、并最終服務于國家相關智能模型魯棒評測標準的推進和開展具有十分重大的意義!因此,來自北京航空航天大學、商湯科技和京東探索研究院的研究人員聯合加州大學伯克利分校、牛津大學以及約翰斯 · 霍普金斯大學提出了第一個在大規模數據集 ImageNet 上面向模型結構(ARchitecture Design)和訓練技巧(Training Technique)且針對多種噪音類型的模型魯棒性評測基準——RobustART

該 benchmark 全面評測了 44 種經典的手工設計和 1200 種 NAS 采樣得到的模型架構以及 10 余種模型訓練技巧對于魯棒性(對抗噪音、自然噪音、系統噪音等)的影響。并通過海量且深入的實驗探究,得出了大量的有價值實驗結果和眾多啟發性的結論,如:

(1)對于 Transformer 和 MLP-Mixer,對抗訓練可以全面提升其全部噪音魯棒性和任務本身的效果;

(2)在模型大小一致的前提下,對于自然噪音和系統噪音魯棒性:CNN>Transformer>MLP-Mixer,對于對抗噪音魯棒性,Transformer>MLP-Mixer>CNN;

(3)對于一些輕量化的模型族,增加其模型大小或者增加訓練數據并不能提升其魯棒性等。這些分析和結論將對人們認識模型魯棒性機理并設計安全穩固的模型架構產生重要的意義。

RobustART benchmark(1)提供了一個包含 leaderboard、數據集、源碼等詳實信息在內的開源平臺;(2)開放了 80 余種使用不同模型結構和訓練技巧的預訓練模型,以便于研究人員進行魯棒性評估;(3)貢獻了嶄新的視角和大量的分析結論,讓研究人員更好地理解魯棒模型背后的內在機制。

RobustART 將作為核心組成部分,整合到北航團隊先前研發的人工智能算法與模型安全評測環境「重明」 系統當中,并發布「重明」2.0 版本(「重明」 是國內領先的智能安全評測環境,曾受邀在國家新一代人工智能開源社區 OpenI 啟智開源開放平臺發布,并榮獲 OpenI 社區優秀開源項目)。在未來,RobustART 將持續為整個社區提供更加完善、易用的開源魯棒性評估和研究框架。同時也將助力于工業級模型的評測和魯棒模型的落地應用,最終也希望能夠服務于國家相關智能模型魯棒評測標準的推進和任務的開展。

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?
  • 論文地址:https://arxiv.org/pdf/2109.05211.pdf
  • RobustART 開源平臺網址:http://robust.art/
  • 重明平臺網址:https://github.com/DIG-Beihang/AISafety

一、概要

目前的魯棒性 benchmark 主要聚焦于評估對抗防御方法的效果,而忽略了模型結構和訓練技巧對于魯棒性的影響。而這些因素對模型魯棒性十分重要,一些細微的差別(如訓練使用的數據增強方法的不同)就可能掩蓋防御方法帶來的魯棒性影響,從而造成對模型魯棒性的錯誤評估和認識。因此,該論文提出了 RobustART 來全面地評測不同模型結構和訓練技巧對于魯棒性的影響,并在對抗噪音(AutoAttack、PGD 等)、自然噪音(如 ImageNet-A, -O, -C, -P)和系統噪音(如 ImageNet-S)下進行了全面評估。下表給出了在研究的 44 種經典網絡模型中,在不同噪音下魯棒性前五名的模型(為了公平比較,所有模型的訓練設置都已對齊):

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

二、考慮模型結構和訓練技巧的魯棒性 benchmark

為了更好地探究模型魯棒性的內在本質,該研究將影響模型魯棒性的原因劃分成模型結構和訓練技巧這兩個正交因素,進而構建了一套完整的 benchmark 設置,即(1)對不同網絡結構的模型,使用同樣的訓練技巧進行訓練(2)對于同一種網絡結構的模型,使用不同的訓練技巧進行訓練。這種細分的消融研究更有助于人們理解某些具體的模型結構或者訓練技巧對于魯棒性的影響。下表分別展示了研究中用到的模型結構、訓練技巧、以及噪音類型。

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

針對模型結構這一因素,該研究盡可能多地覆蓋了常用的神經網絡模型。對于 CNNs,有經典的大型結構如 ResNet、ResNeXt、WideResNet、DenseNet;輕量化網絡如 ShuffleNetV2、MobileNetV2;重參數化的結構 RepVGG;基于神經架構搜索(NAS)的模型如 RegNet、EfficientNet、MobileNetV3 以及使用 BigNAS 超網采樣得到的子網絡;對于非 CNN 網絡,有 ViT 和 DeiT,以及最近的基于 MLP 結構的 MLP-Mixer。總計 44 種典型的手工設計的網絡模型和 1200 種超網采樣出的子網模型,在實驗中它們的訓練設置都將被對齊。

針對訓練技巧這一因素,該研究選取了較為主流的一些技巧進行探究,有知識蒸餾、自監督訓練、權重平均、權重重參數化、標簽平滑、Dropout、數據增強、大規模預訓練、對抗訓練、不同的優化器等。在實驗中選取部分模型結構,通過比較使用某訓練技巧進行訓練和不使用該技巧訓練對模型魯棒性的影響來探究該訓練技巧對魯棒性起到的作用。

為了全面完整地對模型魯棒性進行評估,該研究選用了三種不同類型的噪音來對模型進行測試:對抗噪音、自然噪音、系統噪音。其中,對于對抗噪音選用了 8 種主流的對抗攻擊方法,覆蓋了不同的攻擊強度和黑白盒攻擊:FGSM、PGD-

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

、AutoAttack-

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

、以及基于遷移的對抗攻擊;對于自然噪音選用了 4 種主流的數據集:ImageNet-C、ImageNet-P、ImageNet-A、ImageNet-O;對于系統噪音選用了 ImageNet-S 數據集。此外,對于每種噪音都選擇了相應的評估指標進行測評。

RobustART 整體采用了層次化和模塊化的框架設計,如下圖所示,底層使用了 Pytorch 作為深度學習框架,并使用了 FoolBox、ART 等對抗工具庫,且提供了多種數據集的支持。用戶接口層次主要分為 Models、Training、Noises、Evaluation 這四大模塊,每個模塊提供了可調用的 API 供用戶使用。通過使用 RobustART 的開源框架,用戶可以(1)方便地使用提供的代碼復現結果以及進行更加深入的分析;(2)通過提供的 API 添加新模型、訓練技巧、噪音、評估指標等來進行更多的實驗;(3)使用提供的預訓練模型和研究結果進行下游的應用或者作為比較的基線。

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

三、實驗結果與分析

3.1 模型結構對于魯棒性的影響

該研究首先選用了來自 13 個模型族的共 44 個典型的網絡模型,使用對齊的實驗設置對它們進行訓練,然后對它們進行魯棒性評估。下面兩張圖分別展示了所有模型在各種噪音下模型大小與魯棒性的關系以及在面對遷移性對抗攻擊時的熱力圖:

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?
44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

通過圖中各模型間魯棒性的對比,可以看到:

  • 對于幾乎所有模型族(除了 MobileNetV2 等輕量化的模型族),增大模型大小能夠同時提高泛化性以及對于對抗、自然、以及系統噪音的魯棒性。
  • 在模型大小類似的情況下,不同的模型結構可能有著截然不同的魯棒性,這也意味著模型結構對于魯棒性是非常重要的。具體的,ViT、MLP-Mixer 這類非 CNN 的模型在對抗噪音下表現更為優秀,而傳統的 CNN 模型(如 ResNet、ResNeXt)則對于自然噪音和系統噪音更加魯棒。
  • 不同的噪音對于最終魯棒性的評估結果影響很大,對于同一類型的噪音(如對抗噪音),不同的攻擊方法可能導致不同的模型魯棒性結果;甚至對于同一種對抗攻擊,不同的噪音大小也可能會導致魯棒性評估結果的不同。

除了 44 個典型的網絡模型,該研究還從 BigNAS 超網中采樣了 1200 個子網,探究子網模型參數(如模型大小、輸入圖片大小、深度、卷積核大小等)對于魯棒性的影響,如下圖所示:

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

可以看出模型大小、卷積核大小、模型最后一個 stage 的深度對于對抗魯棒性有著正向的影響,而輸入圖片的大小則對對抗魯棒性有負面的影響。

3.2 訓練技巧對于魯棒性的影響

該研究針對 10 余種特定的訓練技巧,選取部分模型來評估有 / 無這些技巧對于模型的魯棒性影響,部分結果如下圖所示:

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

從實驗結果可以得出較多有意義的結論,如:

  • 對抗訓練:對于 CNNs,對抗訓練提升了模型的對抗魯棒性,然而降低了 Clean 數據集上的泛化性以及對于自然噪音和系統噪音的魯棒性;該研究還首次發現了對于 ViTs 和 MLP-Mixer,對抗訓練顯著提升了 Clean 數據集上的泛化性以及對于所有三種噪音的魯棒性,這對于對抗訓練在真實場景中的實際應用有重大意義。
  • ImageNet-21K 預訓練:該技巧提升了模型對于自然噪音的魯棒性,卻降低了對于對抗噪音和系統噪音的魯棒性。
  • 數據增強:該技巧降低了模型在對抗噪音上的魯棒性,并在大多數情況下提升了模型對于自然噪音的魯棒性。
  • AdamW 優化器:相比于基礎的 SGD 優化器,該技巧略微降低了 ResNet、RegNetX 等大型模型的魯棒性,卻明顯提升了 MobileNetV3 和 ShuffleNetV2 等輕量化模型在 Clean 數據集上的泛化性以及對于所有三種噪音的魯棒性。

四、展望

在深度學習模型大量應用于人臉識別、自動駕駛等關鍵領域的今天,人們越發意識到人工智能安全的重大意義,而人工智能安全相關的研究和標準也亟待進一步推進和落實。本研究所提出的 RobustART 為我們帶來了一個全面、標準的模型魯棒性評估的開源平臺和框架,并在此基礎上進行了大量的實驗研究,得出了大量有啟發性的結論。這將幫助我們進一步認識和理解模型魯棒性與結構、訓練技巧之間的關系,讓我們對魯棒性有了更加全面深入的認識。該研究將與現有的面向防御的魯棒性 benchmark 互補,共同構建完善的魯棒性基準,推動魯棒性研究生態系統在機器學習社區中的長遠發展。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2023-10-09 09:42:18

自動駕駛模型

2024-01-18 13:38:00

AI數據

2015-07-07 18:01:07

容器操作系統應用管理

2025-03-10 09:22:00

2024-06-18 09:43:26

2020-10-05 22:00:59

深度學習編程人工智能

2023-01-09 13:21:29

模型

2025-01-23 10:45:52

2022-04-18 15:56:49

AI模型系統

2010-07-08 09:46:32

2022-12-20 10:58:49

數據集工具

2020-02-25 20:55:20

JavaScript開發 技巧

2022-02-21 08:00:00

管理系統應用程序模式

2013-12-02 00:02:58

2024-07-10 10:19:26

2015-06-19 11:08:05

JavaScript圖表庫

2024-11-18 07:45:00

2024-04-18 10:39:57

2011-06-09 17:16:30

一體機評測
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人久久18免费 | 九九热精品免费 | 91麻豆精品国产91久久久久久久久 | 中文字幕亚洲视频 | 国产精品日韩欧美一区二区 | 国产精品久久国产精品久久 | 日韩欧美视频网站 | 日韩精品一区二区三区在线观看 | 日韩aⅴ片 | 国产网站在线免费观看 | 91在线观看网址 | www.日本在线 | 久久精品成人热国产成 | 亚洲精品乱码久久久久久黑人 | 亚洲精品久久久久久国产精华液 | 久久久久久国产精品久久 | 国产一区二区三区免费观看在线 | 日韩精品一区二区三区四区 | 亚洲成人福利在线观看 | 欧美精品一区二区三区在线播放 | 日本精品视频在线 | 天天宗合网 | www.9191 | 国产午夜精品福利 | 久www | 国产传媒视频在线观看 | 天堂久久久久久久 | 国产高清无av久久 | 国产成人精品一区二区三区 | 国产视频在线观看一区二区三区 | 欧美三级电影在线播放 | 国产一区二区在线91 | 91精品国产综合久久福利软件 | 欧美日一区二区 | www.国产一区 | 欧美精品一区二区三区四区五区 | 午夜免费小视频 | 色黄网站 | 91精品国产91久久久久久吃药 | 日韩毛片在线观看 | 成人在线一区二区三区 |