成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟提出自動化神經網絡訓練剪枝框架OTO,一站式獲得高性能輕量化模型

人工智能 新聞
OTO 是業內首個自動化、一站式、用戶友好且通用的神經網絡訓練與結構壓縮框架。

在人工智能時代,如何部署和維護神經網絡是產品化的關鍵問題考慮到節省運算成本,同時盡可能小地損失模型性能,壓縮神經網絡成為了 DNN 產品化的關鍵之一。

圖片

DNN 壓縮通常來說有三種方式,剪枝,知識蒸餾和量化。剪枝旨在識別并去除冗余結構,給 DNN 瘦身的同時盡可能地保持模型性能,是最為通用且有效的壓縮方法。三種方法通常來講可以相輔相成,共同作用來達到最佳的壓縮效果。

圖片

然而現存的剪枝方法大都只針對特定模型,特定任務,且需要很強的專業領域知識,因此通常需要 AI 開發人員花費大量的精力才能將這些方法應用于自己的場景中,非常消耗人力物力成本。

OTO 概述

為了解決現存剪枝方法的問題并給 AI 開發者提供便利,微軟團隊提出了 Only-Train-Once OTO 框架。OTO 是業內首個自動化、一站式、用戶友好且通用的神經網絡訓練與結構壓縮框架,系列工作陸續發表于 ICLR2023 和 NeurIPS2021。

通過使用 OTO,AI 工程師可以方便地訓練目標神經網絡,一站式地取得高性能且輕量化的模型。OTO 最小化了開發者的工程時間精力的投入,且全程無需現有方法通常需要的非常耗時的預訓練和額外的模型微調。

  • 論文鏈接:
  • OTOv2 ICLR 2023: https://openreview.net/pdf?id=7ynoX1ojPMt
  • OTOv1 NeurIPS 2021:https://proceedings.neurips.cc/paper_files/paper/2021/file/a376033f78e144f494bfc743c0be3330-Paper.pdf
  • 代碼鏈接:
    ?https://github.com/tianyic/only_train_once

框架核心算法

理想化的結構剪枝算法應該做到:針對通用神經網絡,自動化地一站式地從零開始訓練,同時達到高性能且輕量化的模型,并無需后續微調。但因為神經網絡的復雜性,實現這一目標是一件極其有挑戰性的事情。為了實現這一最終目的,下面的三個核心問題需要被系統性地解決:

  • 如何找出哪些網絡結構可以被移除?
  • 如何在移除網絡結構的過程中,盡可能不損失模型性能?
  • 如何能自動化地完成如上兩點?

微軟團隊設計并實現了三套核心算法,首次系統性地,全面性地解決這三個核心問題。

自動化 Zero-Invariant Groups (零不變組) 分組

由于網絡結構的復雜性和關聯性,刪去任意網絡結構可能會導致剩余的網絡結構無效。因此自動化網絡結構壓縮的一個最大的問題之一是如何找到必須要被一起剪枝的模型參數,使得余下的網絡依然有效。為了解決該問題,微軟團隊在 OTOv1 中提出了零不變組 Zero-Invariant Groups  (ZIGs)。零不變組可以理解為一類最小的可移除單元,使得該組對應的網絡結構移除后剩余網絡依然有效。零不變組的另一大特性是,如果一個零不變組等于零,那么無論輸入值是什么,輸出值永遠是零。在 OTOv2 中,研究者進一步提出并實現了一套自動化算法來解決通用網絡的零不變組的分組問題。自動化分組算法是由一系列圖算法精心設計組合而成,整套算法非常高效,具有線性的時間空間復雜度。

圖片

雙半平面投影梯度優化算法 (DHSPG)

當劃分目標網絡所有的零不變組后,接下來的模型訓練和剪枝任務需要找出哪些零不變組是冗余的,哪些又是重要的。冗余的零不變組對應的網絡結構需要被刪除,重要的零不變組需要保留并保證壓縮模型的性能。研究者公式化這個問題為一個結構性稀疏化問題,并提出全新的 Dual Half-Space Projected Gradient  (DHSPG) 優化算法來解決。

圖片

DHSPG 可以非常有效地找出冗余的零不變組并將其投影成零,并持續訓練重要的零不變組來取得跟原始模型相媲美的性能。

與傳統稀疏優化算法相比,DHSPG 具有更強更穩定地稀疏結構探索能力,且擴展了訓練搜索空間并因此通常要獲得更高的實際表現效果。

圖片

自動化構建輕量壓縮模型

通過使用 DHSPG 對模型進行訓練,我們會得到一個服從于零不變組的高結構稀疏性的解,即該解里有很多被投影成零的零不變組,此外該解還會具有很高的模型性能。接下來,研究者把所有對應與冗余零不變組的結構刪去來自動化地構建壓縮網絡。由于零不變組的特性,即如果一個零不變組等于零,那么無論輸入值是什么,輸出值永遠是零,因此刪去冗余的零不變組不會對網絡產生任何影響。所以通過 OTO 得到的壓縮網絡和完整網絡會有相同的輸出,無需傳統方法所需要的進一步模型微調。

數值實驗

分類任務

圖片

表 1:CIFAR10 中的 VGG16 及 VGG16-BN 模型表現

在 CIFAR10 的 VGG16 實驗中,OTO 將浮點數減少了 86.6%,將參數量減少了 97.5%,性能表現令人印象深刻。

圖片

表 2:CIFAR10 的 ResNet50 實驗

在 CIFAR10 的 ResNet50 實驗中,OTO 在沒有量化的情況下優于 SOTA 神經網絡壓縮框架 AMC 和 ANNC,僅使用了 7.8% 的 FLOPs 和 4.1% 的參數。

圖片

表 3. ImageNet 的 ResNet50 實驗

在 ImageNet 的 ResNet50 實驗中,OTOv2 在不同結構稀疏化目標下,展現出跟現存 SOTA 方法相媲美甚至更優的表現。

圖片

表 4: 更多結構和數據集

OTO 也在更多的數據集和模型結構上取得了不錯的表現。

Low-Level Vision 任務

圖片

表 4:CARNx2 的實驗

在 super-resolution 的任務中,OTO 一站式訓練壓縮了 CARNx2 網絡,得到了跟原始模型有競爭力的性能且壓縮了越 75% 的運算量和模型大小。 

語言模型任務

圖片

此外,研究者還在 Bert 上針對核心算法之一,DHSPG 優化算法,進行了對比試驗,驗證了其相較于其他稀疏優化算法的高性能性。可以發現在 Squad 上,利用 DHSPG 進行訓練所得到的參數量減小和模型性能要遠遠優于其他稀疏優化算法。

結論

微軟團隊提出了一個名為 OTO(Only-Train-Once)的 自動化一站式神經網絡訓練結構剪枝框架。它可以將一個完整的神經網絡自動化地壓縮為輕量級網絡,同時保持較高的性能。OTO 大大簡化了現有結構剪枝方法復雜的多階段流程,適合各類網絡架構和應用,且最小化了用戶的額外工程投入,具有通用性,有效性和易用性。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2009-07-27 11:37:04

網絡拓撲摩卡

2010-08-12 16:18:17

網絡拓撲運維管理摩卡軟件

2021-08-17 11:29:13

框架架構開發

2014-01-13 09:00:54

PythonDjango

2013-10-24 17:35:01

云網絡H3C電子政務

2017-07-03 10:55:48

神經網絡深度學習

2025-03-31 08:50:00

模型量化神經網絡AI

2025-02-12 13:44:12

2009-07-30 21:16:29

布線服務電纜架設

2017-05-04 21:30:32

前端異常監控捕獲方案

2009-10-23 09:42:24

2022-09-16 11:27:46

建設微服務

2024-08-19 09:05:00

Seata分布式事務

2023-10-26 06:59:58

FinOps云原生

2009-10-28 09:48:08

“一站式”網絡運維

2012-06-27 10:31:30

天璣科技企業信息化IT服務

2012-04-09 17:36:38

華為智真

2021-12-07 10:04:34

Azure Kuber場景應用

2025-05-06 13:42:16

微軟Phi-4模型

2013-09-25 09:58:17

虛擬化網絡
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品久久久久一区二区三区 | 午夜寂寞影院在线观看 | 国精产品一品二品国精在线观看 | 九九久久精品视频 | 成人精品一区二区三区 | 午夜欧美日韩 | 欧美jizzhd精品欧美巨大免费 | 在线成人免费视频 | 成人免费视频网站在线看 | 成人在线播放 | 亚洲精品一区二区网址 | 精品国产欧美一区二区三区不卡 | 91av视频在线播放 | 亚洲精品自在在线观看 | 99精品视频免费观看 | 国产999精品久久久久久绿帽 | 久久久久久综合 | 欧美一级淫片免费视频黄 | 精品国产91久久久久久 | 成人av网站在线观看 | 亚洲视频免费 | 精品一区二区三区免费视频 | 国产不卡视频 | 一区二区在线视频 | 丝袜一区二区三区 | 亚洲午夜小视频 | 国产在线精品一区二区三区 | 96久久久久久 | 99国产精品99久久久久久粉嫩 | 久久se精品一区精品二区 | 凹凸日日摸日日碰夜夜 | 蜜桃传媒一区二区 | 日韩在线成人 | 欧美9999| 日韩一区二区三区在线观看视频 | 日韩电影免费观看中文字幕 | 国内精品视频在线观看 | 久久三区 | 天天天操 | 另类a v| 你懂的av|