成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

首次將「教導主任」引入模型蒸餾,大規模壓縮優于24種SOTA方法

人工智能 新聞
來自人民中科和中科院自動化所的研究者,他們提出了一種基于 “教導主任 - 教師 - 學生” 模式的統一的模型壓縮技術。在與 24 種主流模型壓縮方法進行比較后,證明本文所提方法的優越性。

面對越來越深的深度學習模型和海量的視頻大數據,人工智能算法對計算資源的依賴越來越高。為了有效提升深度模型的性能和效率,通過探索模型的可蒸餾性和可稀疏性,本文提出了一種基于 “教導主任 - 教師 - 學生” 模式的統一的模型壓縮技術。

該成果由人民中科和中科院自動化所聯合研究團隊合作完成,相關論文發表在人工智能頂級國際期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 上。該成果是首次將 “教導主任” 角色引入模型蒸餾技術,對深度模型的蒸餾與裁剪進行了統一。

圖片

論文地址:https://ieeexplore.ieee.org/abstract/document/9804342

目前該項成果已經應用于人民中科自主研發的跨模態智能搜索引擎 “白澤”。“白澤” 打破圖文音視等不同模態間信息表達的隔閡,將文字、圖片、語音和視頻等不同模態信息映射到一個統一特征表示空間,以視頻為核心,學習多個模態間統一的距離度量,跨越文字、語音、視頻等多模態內容的語義鴻溝,實現大一統的搜索能力。

然而面對海量的互聯網數據尤其是視頻大數據,跨模態的深度模型對計算資源的消耗逐漸提升。基于該項研究成果,“白澤”能夠在保證算法性能的情況下,將模型大小進行大規模壓縮,從而實現高通量低功耗的跨模態智能理解和搜索能力。根據初步的實際應用情況來看,該項技術能夠將大模型的參數規模壓縮平均四倍以上。一方面能夠極大降低模型對 GPU 服務器等高性能計算資源的消耗,另一方面能夠將無法在邊緣端部署的大模型經過蒸餾壓縮后實現邊緣端的低功耗部署。

模型壓縮的聯合學習框架

深度算法模型的壓縮和加速可通過蒸餾學習或結構化稀疏裁剪實現,但這兩個領域均存在一些局限性。對于蒸餾學習方法,旨在訓練一個輕量化模型(即學生網絡)來模擬復雜龐大的模型(即教師網絡)。在教師網絡的指導下,學生網絡可以獲得比單獨訓練的更優性能。

然而,蒸餾學習算法僅僅專注于提升學生網絡的性能,往往忽略了網絡結構的重要性。學生網絡的結構一般是預定義好的,并且在訓練過程中是固定的。

對于結構化稀疏裁剪或濾波器裁剪,這些方法旨在將一個冗余繁雜的網絡裁剪成一個稀疏緊致的網絡。然而,模型裁剪僅僅用于獲得一個緊致的結構。目前已有方法都沒有充分利用原始復雜模型所包含的“知識”。近期研究為了平衡模型性能和大小,將蒸餾學習和結構化稀疏裁剪進行結合。但是這些方法僅限于簡單的損失函數的結合。

為了深入分析以上問題,該研究首先對模型進行基于壓縮感知訓練,通過分析模型性能和結構發現,對于深度算法模型,存在兩個重要屬性:可蒸餾性(distillability)和可稀疏性(sparsability)。

具體而言,可蒸餾性指的是能夠從教師網絡中蒸餾出有效知識的密度。它可以通過學生網絡在教師網絡指導下所獲得的性能收益來衡量。例如,擁有更高可蒸餾性的學生網絡可以獲得更高性能。可蒸餾性也可以在網絡層級別上被定量分析。

如圖 1-(a)所示,柱形圖表示蒸餾學習損失梯度和真值分類損失梯度之間的余弦相似度(Cosine Similarity)。更大的余弦相似度說明當前蒸餾的知識對于模型性能更有幫助。這樣,余弦相似度也可以成為可蒸餾性的一種度量。由圖 1-(a)可得,可蒸餾性隨著模型層數變深逐漸增大。這也解釋了為什么常規使用蒸餾學習的監督均施加在模型最后幾層中。并且,在不同的訓練輪次,學生模型也有不同的可蒸餾性,因為隨著訓練時間變化余弦相似度也在改變。因此,在訓練過程中對不同層進行可蒸餾性的動態分析十分必要。

另一方面,可稀疏性指的是模型在有限精度損失下能夠獲得的裁剪率(或稱壓縮率)。更高的可稀疏性對應更高裁剪率的潛力。如圖 1-(b)所示,網絡的不同層或模塊展現了不同的可稀疏性。類似于可蒸餾性,可稀疏性也可以在網絡層級別和時間維度進行分析。然而,目前沒有方法去探索和分析可蒸餾性和可稀疏性。現有方法常常使用一種固定的訓練機制,這樣很難達到一個最優結果。

圖片

圖片

圖 1 深度神經網絡的可蒸餾性和可稀疏性示意圖

為了解決以上問題,該研究分析了模型壓縮的訓練過程,從而獲得有關可蒸餾性和可稀疏性的相關發現。受這些發現啟發,該研究提出了一種基于動態可蒸餾性與可稀疏性聯合學習的模型壓縮方法。它能動態結合蒸餾學習和結構化稀疏裁剪,通過學習可蒸餾性和可稀疏性,自適應地調節聯合訓練機制。

與常規的 “教師 - 學生(Teacher-Student)” 框架不同,本文提出的方法能夠被描述成 “在學校學習(Learning-in-School)” 框架,因為它包含三大模塊:教師網絡,學生網絡和教導主任網絡。

具體而言,與之前相同,教師網絡教導學生網絡。而教導主任網絡負責控制學生網絡學習的強度以及學習的方式。通過獲取當前教師網絡和學生網絡的狀態,教導主任網絡可以評估當前學生網絡的可蒸餾性和可稀疏性,然后動態地平衡和控制蒸餾學習監督和結構化稀疏裁剪監督的強度。

為了優化本文方法,該研究還提出一種基于交替方向乘子法的蒸餾學習 & 裁剪的聯合優化算法,來更新學生網絡。為了優化和更新教導主任網絡,本文提出一種基于元學習的教導主任優化算法。借助動態調節監督信號,反過來可蒸餾性也能被影響。如圖 1-(a)所示,本文方法證明能夠延緩可蒸餾性的下降趨勢,并且通過合理利用蒸餾的知識,提升了整體的可蒸餾性。

本文方法的整體算法框架和流程圖如下圖所示。該框架包含三大模塊,教師網絡,學生網絡和教導主任網絡。其中,初始的待壓縮裁剪的復雜冗余網絡被看作教師網絡,而在后面的訓練過程中,逐漸被稀疏的原始網絡被看作是學生網絡。教導主任網絡是一個元網絡,它輸入教師網絡和學生網絡的信息來衡量當前可蒸餾性和可稀疏性,從而控制蒸餾學習和稀疏的監督強度。

這樣,在每一時刻,學生網絡都能被動態地蒸餾知識指導和被稀疏。例如,當學生網絡有更高的可蒸餾性,則教導主任會讓更強的蒸餾監督信號指導學生網絡(見圖 2 中粉色箭頭信號);與此相反,當學生網絡有更高的可稀疏性,教導主任會讓更強的稀疏監督信號施加于學生網絡中(見圖 2 中橙色箭頭信號)。

圖片

圖 2 基于可蒸餾性與可稀疏性聯合學習的模型壓縮算法示意圖

實驗結果

實驗將本文提出的方法與 24 種主流模型壓縮方法(包括稀疏裁剪方法和蒸餾學習方法)在小規模數據集 CIFAR 和大規模數據集 ImageNet 上進行比較。實驗結果如下圖所示,結果證明本文所提方法的優越性。

表 1 在 CIFAR10 上的模型裁剪結果性能對比:

圖片

表 2 在 ImageNet 上的模型裁剪結果性能對比:

圖片

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-01-03 16:54:27

字節跳動深度學習

2025-05-12 09:00:00

2017-01-20 08:53:37

數據系統架構驅動

2025-03-18 08:19:01

2013-04-07 13:58:00

2022-07-07 11:00:09

美團模型實踐

2022-12-25 12:57:00

模型自然學習

2024-12-04 09:15:00

AI模型

2023-06-28 08:23:41

搜索語義模型

2010-05-12 11:34:37

WiFi

2011-12-29 17:27:37

IPv6IPv4ARIN

2023-04-06 16:29:18

模型AI

2023-07-23 17:30:36

論文模型

2009-03-18 08:19:30

Myspace裁員搜索

2024-11-18 08:08:21

2013-10-10 16:54:29

3D 打印3D 打印技術開源硬件

2010-09-01 15:16:49

WLAN交換機結構

2016-01-29 20:23:23

華為

2009-04-09 09:32:00

VoWLANWLAN

2017-04-26 13:30:24

爬蟲數據采集數據存儲
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品欧美乱码久久久久久 | 97久久久久久久久 | 亚洲精品久久久久久久久久久久久 | 免费黄篇| 91资源在线 | 亚洲视频区 | 国产日韩一区二区三区 | 欧美日日| 日本精品视频 | aa级毛片毛片免费观看久 | 欧美日韩中文字幕在线 | 国产视频中文字幕 | 夜夜操天天干 | 人人澡人人射 | 久久精品久久久久久 | 久久成人在线视频 | 户外露出一区二区三区 | 黑人精品欧美一区二区蜜桃 | 亚洲一区二区电影在线观看 | 免费看欧美一级片 | 国产91精品网站 | 先锋资源亚洲 | 精产国产伦理一二三区 | 国产成人综合网 | 人人天天操 | 草b视频| 亚洲色图图片 | 欧产日产国产精品视频 | 欧美黄 片免费观看 | 成人老司机 | 精品免费国产一区二区三区四区 | 欧洲高清转码区一二区 | av黄色在线观看 | 国产99在线 | 欧美 | 激情欧美日韩一区二区 | 国产精品久久久久久久白浊 | 亚洲精品2 | 国产精品成人国产乱一区 | 亚洲一区二区免费看 | 国产农村妇女毛片精品久久麻豆 | 国产精品久久欧美久久一区 |