成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Batch Normalization的詛咒

人工智能 深度學習
Batch Normalization是一種被廣泛采用的技術,使訓練更加快速和穩定,已成為最有影響力的方法之一。然而,盡管它具有多種功能,但仍有一些地方阻礙了該方法的發展。

Batch Normalization確實是深度學習領域的重大突破之一,也是近年來研究人員討論的熱點之一。Batch Normalization是一種被廣泛采用的技術,使訓練更加快速和穩定,已成為最有影響力的方法之一。然而,盡管它具有多種功能,但仍有一些地方阻礙了該方法的發展,正如我們將在本文中討論的那樣,這表明做歸一化的方法仍有改進的余地。

[[349995]]

一、我們為什么要用Batch Normalization?

在討論任何事情之前,首先,我們應該知道Batch Normalization是什么,它是如何工作的,并討論它的用例。

1. 什么是Batch Normalization

在訓練過程中,當我們更新之前的權值時,每個中間激活層的輸出分布會在每次迭代時發生變化。這種現象稱為內部協變量移位(ICS)。所以很自然的一件事,如果我想防止這種情況發生,就是修正所有的分布。簡單地說,如果我的分布變動了,我會限制住這個分布,不讓它移動,以幫助梯度優化和防止梯度消失,這將幫助我的神經網絡訓練更快。因此減少這種內部協變量位移是推動batch normalization發展的關鍵原則。

2. 它如何工作

Batch Normalization通過在batch上減去經驗平均值除以經驗標準差來對前一個輸出層的輸出進行歸一化。這將使數據看起來像高斯分布。

Batch Normalization的詛咒

其中μ和*σ^2^*分別為批均值和批方差。

Batch Normalization的詛咒

并且,我們學習了一個新的平均值和協方差γ和β。所以,簡而言之,你可以認為batch normalization是幫助你控制batch分布的一階和二階動量。

Batch Normalization的詛咒

vgg16網絡的中間卷積層的特征分布輸出。(左)沒有任何歸一化,(右)應用了batch normalization

3. 優點

我將列舉使用batch normalization的一些好處,但是我不會詳細介紹,因為已經有很多文章討論了這個問題。

  • 更快的收斂。
  • 降低初始權重的重要性。
  • 魯棒的超參數。

需要較少的數據進行泛化。

 

Batch Normalization的詛咒

 

 

1. 更快的收斂,2. 對超參數更魯棒

 

二、Batch Normalization的詛咒

好,讓我們回到本文的出發點,在許多情況下batch normalization開始傷害性能或根本不起作用。

1. 在使用小batch size的時候不穩定

如上所述,batch normalization必須計算平均值和方差,以便在batch中對之前的輸出進行歸一化。如果batch大小比較大的話,這種統計估計是比較準確的,而隨著batch大小的減少,估計的準確性持續減小。

Batch Normalization的詛咒

ResNet-50在Batch Norm使用32、16、8、4、2張/GPU圖像時的驗證錯誤

以上是ResNet-50的驗證錯誤圖。可以推斷,如果batch大小保持為32,它的最終驗證誤差在23左右,并且隨著batch大小的減小,誤差會繼續減小(batch大小不能為1,因為它本身就是平均值)。損失有很大的不同(大約10%)。

如果batch大小是一個問題,為什么我們不使用更大的batch?我們不能在每種情況下都使用更大的batch。在finetune的時候,我們不能使用大的batch,以免過高的梯度對模型造成傷害。在分布式訓練的時候,大的batch最終將作為一組小batch分布在各個實例中。

2. 導致訓練時間的增加

NVIDIA和卡耐基梅隆大學進行的實驗結果表明,“盡管Batch Normalization不是計算密集型,而且收斂所需的總迭代次數也減少了。”但是每個迭代的時間顯著增加了,而且還隨著batch大小的增加而進一步增加。

Batch Normalization的詛咒

ResNet-50 在ImageNet上使用 Titan X Pascal

你可以看到,batch normalization消耗了總訓練時間的1/4。原因是batch normalization需要通過輸入數據進行兩次迭代,一次用于計算batch統計信息,另一次用于歸一化輸出。

3. 訓練和推理時不一樣的結果

例如,在真實世界中做“物體檢測”。在訓練一個物體檢測器時,我們通常使用大batch(YOLOv4和Faster-RCNN都是在默認batch大小= 64的情況下訓練的)。但在投入生產后,這些模型的工作并不像訓練時那么好。這是因為它們接受的是大batch的訓練,而在實時情況下,它們的batch大小等于1,因為它必須一幀幀處理。考慮到這個限制,一些實現傾向于基于訓練集上使用預先計算的平均值和方差。另一種可能是基于你的測試集分布計算平均值和方差值。

4. 對于在線學習不好

與batch學習相比,在線學習是一種學習技術,在這種技術中,系統通過依次向其提供數據實例來逐步接受訓練,可以是單獨的,也可以是通過稱為mini-batch的小組進行。每個學習步驟都是快速和便宜的,所以系統可以在新的數據到達時實時學習。

Batch Normalization的詛咒

典型的在線學習pipeline

由于它依賴于外部數據源,數據可能單獨或批量到達。由于每次迭代中batch大小的變化,對輸入數據的尺度和偏移的泛化能力不好,最終影響了性能。

5. 對于循環神經網絡不好

雖然batch normalization可以顯著提高卷積神經網絡的訓練和泛化速度,但它們很難應用于遞歸結構。batch normalization可以應用于RNN堆棧之間,其中歸一化是“垂直”應用的,即每個RNN的輸出。但是它不能“水平地”應用,例如在時間步之間,因為它會因為重復的重新縮放而產生爆炸性的梯度而傷害到訓練。

[^注]: 一些研究實驗表明,batch normalization使得神經網絡容易出現對抗漏洞,但我們沒有放入這一點,因為缺乏研究和證據。

可替換的方法

這就是使用batch normalization的一些缺點。在batch normalization無法很好工作的情況下,有幾種替代方法。

  • Layer Normalization
  • Instance Normalization
  • Group Normalization (+ weight standardization)
  • Synchronous Batch Normalization

總結

所以,看起來訓練深度神經網絡很簡單,但我不認為它很容易。從這個意義上說,我可以選擇的架構很少,每個模型都有固定的學習速度,固定的優化器和固定的技巧。這些技巧是通過自然選擇選擇的,就像有人想出了一些技巧,人們引入之后如果有效,就會保留,如果無效,人們最終會忘記,并沒有人再去使用它。除此之外,batch normalization是深度學習發展中的一個里程碑技術。然而,正如前面所討論的,沿著batch 維度進行歸一化引入了一些問題,這表明歸一化技術仍有改進的空間。

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2019-06-19 09:13:29

機器學習中數據集深度學習

2011-03-03 11:21:52

PHPPythonJavaScript

2011-06-01 14:29:29

編程語言

2010-12-30 12:15:47

wifiWi-Fi無線網絡

2011-05-10 10:07:53

Windows

2013-12-04 09:52:27

程序員漫畫

2012-09-29 11:38:27

編程工具文本編輯器編程

2021-05-31 09:41:17

機器學習人工智能計算機

2010-07-27 14:52:37

Batch Telne

2025-02-12 13:42:25

2010-07-26 14:46:08

batch Telne

2025-04-29 08:00:36

2018-05-17 22:32:29

AWS BatchCLI代碼

2009-06-18 15:40:07

Spring Batc

2010-07-16 10:31:02

Batch Telne

2009-07-24 16:42:46

iBatis框架做ba

2010-07-22 12:15:59

Batch Telne

2010-07-17 00:50:12

batch Telne

2023-11-18 09:40:58

數據模型

2010-07-22 10:58:49

batch Telne
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美黑人激情 | 免费观看www7722午夜电影 | 香蕉婷婷| 免费在线看a | 日韩欧美网 | 午夜激情国产 | 久久久久久综合 | 欧美日韩不卡在线 | 在线日韩中文字幕 | 成人午夜视频在线观看 | 精品乱子伦一区二区三区 | 欧美狠狠操 | 97国产爽爽爽久久久 | 午夜在线| 在线观看亚洲 | 三级在线观看 | av在线亚洲天堂 | 国产精品成人一区二区三区吃奶 | 国产午夜精品一区二区三区嫩草 | 日日夜夜天天综合 | 国产精品日韩欧美一区二区 | 国产精品久久久久久 | 国产精品123区 | 欧美黄a | 男人的天堂在线视频 | 欧美1区2区 | 欧美激情综合五月色丁香小说 | 国产精品一区二区不卡 | 男人天堂av网 | 国产一级特黄真人毛片 | 欧美久久久电影 | 又黄又色 | 欧美黄在线观看 | 国产精品久久久久久 | 亚洲国产欧美在线人成 | 国产成人精品网站 | 欧美高清视频 | 久久久精品一区二区三区 | 欧洲国产精品视频 | 岛国av在线免费观看 | 亚洲国产午夜 |