成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

零基礎也能搞懂卷積神經網絡原理!超詳細!

人工智能
相信對AI興趣濃厚的小伙伴們,一定對卷積神經網絡并不陌生, 今天我們將從零開始走進卷積神經網絡的世界!

相信和筆者一樣愛技術對AI興趣濃厚的小伙伴們,一定對卷積神經網絡并不陌生, 也一定曾經對如此“高級”的名字困惑良久。筆者今天將從零開始走進卷積神經網絡的世界~與大家分享!

在深入了解卷積神經網絡之前,我們先看看圖像的原理。

圖像原理

圖像在計算機中是通過數字(0-255)來表示的,每個數字代表圖像中一個像素的亮度或顏色信息。其中:

  • 黑白圖像:每個像素只有一個值,這個值在0(黑色)到255(白色)之間變化。

  • 彩色圖像:每個像素包含三個值,最常見的是RGB(Red-Green-Blue)模型,即紅色、綠色和藍色光以不同強度組合起來產生各種顏色。每個顏色通道都有256級亮度,從0~255,因此每種顏色可以用一個8位的二進制數來表述,例如(255,0,0)表示紅色,(0,255,0)表示綠色,(0,0,255)表示藍色,其他組合則對應各種顏色。計算機中,彩色圖像的數據結構通常是一個三維數組或張量,形狀為(寬度,高度,深度),其中深度就是通道的數量,對于RGB圖像來說,深度是3。這意味著,對于每個像素位置,有三個數值分別代表紅綠藍三個通道的亮度。例如,一個100*100像素的RGB圖像將占用100x100x3個字節的內存。

「這里“8位的二進制數”怎么理解呢?」

在RGB顏色模型中,每個顏色通道(紅、綠、藍)可以有256個不同的亮度級別,每個通道用8位二進制表示。8位二進制數的最大值是11111111,轉化成十進制就是255;最小值是00000000,轉化成十進制就是0。

何為卷積神經網絡CNN?

說起CNN,必然會首先想到的是CV吧,而邊緣檢測可謂是CV中家喻戶曉的一種應用場景。以原始圖片尺寸為10x10為例,如下圖所示,其左半部分是像素值較大,是明亮區域;右半部分像素值較小,為深度區域。中間的分界線即就是要檢測的邊緣。

「那么怎么檢測邊緣呢?」 此時濾波器filter(也叫kernel)出場了,如下圖所示,kernel尺寸為3x3。

濾波器filter滑過輸入圖片,在每個區域處稍做停留,對應元素相乘再相加計算,之后再向其它區域滑動繼續計算,直到滑動至原圖片的最后一個區域為止。這個過程即為「卷積。」

由上圖可以看出,輸出結果的中間顏色淺,兩邊顏色深,說明原圖的邊界已反應出來。「因此可以總結出,邊緣檢測就是通過輸入圖片與相應濾波器進行卷積運算得以識別。」

另外,這里的滑動還涉及到一個基本概念,「步長stride」,上述示例中,是以stride為1說明,每次滑動一格,共停留了8x8個區域,所以最終輸出結果是8x8矩陣。

「那么,究竟什么是卷積神經網絡呢?」

經過上面邊緣檢測這一具體的目標檢測場景的分析,我們也就不難理解,CNN(Convolutional neural network)就是通過各種各樣的濾波器filter不斷提取圖片特征,從局部到整體,進而識別目標。

而在神經網絡中,這些filter中的每個數字,就是參數,可通過大量數據訓練得到(即深度學習的過程)。

CNN中的基本概念

1.卷積(Convolution)

(1) 卷積計算

卷積是數學分析中的一種積分變換的方法,而在圖像處理中則采用的是卷積的離散形式。在卷積神經網絡CNN中,卷積層的實現方式本質即為數學中定義的互相關計算(cross-correlation)。具體計算過程如下圖所示。

其中:

圖(a):左邊的圖大小是3×3,表示輸入數據是一個維度為3×3的二維數組;中間的圖大小是2×2,表示一個維度為 2×2的二維數組,也即為「卷積核」。卷積核的左上角與輸入數據的左上角(0,0)對齊,并依次將二者對應位置數據相乘,再相加,即可獲得卷積輸出的第一個結果25。

依次類推,圖(b)、(c)、(d)分別為卷積輸出的第二、三、四個輸出結果。

(2) 圖片卷積運算

那么圖片卷積運算,具體是怎么回事呢?如下圖所示即為彩色圖像卷積過程。

對于彩色圖像的通道1(Red)、通道2(Green)、通道3(Blue),分別使用Kernel1、Kernel2、Kernel3。每個卷積核在對應的單色圖像上滑動,對每個位置上的小塊區域(Kernel大小)內的像素值與卷積核的相應元素進行逐點乘法運算,然后將這些乘積相加得到一個值。再將每個通道得到的數值相加,并加上總體的偏置Bias,即可得到對應特征圖(feature map)中的一個值。

立體效果如下圖所示:

2.Padding

如上所述邊緣檢測的例子中,可以看到,原圖片尺寸是10x10,經過filter之后是8x8。如果再做一次卷積運算就是6x6...這樣的話會有兩個缺點:

  • 每次做卷積操作,輸出圖片尺寸縮小
  • 角落或邊緣區域的像素點在輸出中采用較少,因此容易丟掉圖像邊緣位置的許多信息。

如下圖中左上角紅色陰影只被一個輸出觸碰到,而中間的像素點(紫色方框標記)會有許多3x3的區域與之重疊。所以,角落或邊緣區域的像素點在輸出中采用較少,容易丟掉圖像邊緣位置的許多信息。

為了解決這一問題,我們通常采用Padding的方法,在卷積操作之前,先給原圖片邊緣填充一層像素, 例如,將10x10的圖像即可填充為12x12的大小,卷積之后的圖片尺寸為8x8,和原始圖片一樣大,這樣便使得原圖的邊緣區域像素點也可以多次被采用。

選擇填充多少像素,通常有兩種選擇:

  • Same卷積:即如上所述,填充再卷積之后的圖片大小與原圖片一致。
  • Valid卷積:不進行填充操作,直接卷積。

3.stride

stride的概念在引言中有提到過,表示過濾器filter在原圖片中水平方向和豎直方向每次滑動的長度,也叫步進長度。

假設s表示stride長度,p表示padding長度,原圖片尺寸是nxn,過濾器filter尺寸是fxf,則卷積后的圖片尺寸為:

4.池化

池化的本質就是降維。

卷積網絡中池化層的作用:降低特征圖的參數量、提升計算速度、增加感受野,也即為一種降采樣操作。

物體檢測中常用的池化:最大值池化(Max Pooling)與平均值池化(Average Pooling)。

(1) Max pooling

即在濾波器filter滑動區域內取最大值,而無需卷積運算。數字大意味著可能探測到了某些特定的特征,忽略了其它值,降低了噪聲影響,提高了模型健壯性。「并且,Max pooling需要的超參數僅為濾波器尺寸f和stride長度s,無需要訓練其它參數,計算量較小。」

(2) Average pooling

即在濾波器filter滑動區域內求平均值。

5.Shape

在處理多維數據,尤其是圖像數據時,Tensorflow和Pytorch數據Shape有所區分。

  • TensorFlow:(batch_size, height, width, in_channels)
  • Pytorch:(batch_size, in_channels, height, width)

其中:

  • batch_size:批量處理的樣本數量。
  • in_channels:輸入圖像的通道數,對于彩色圖像通常是3(紅、綠、藍)。
  • height和width分別是圖像的高度和寬度。

如上圖所示:

  • 輸入圖片Shape:[height, width, channels],即[8,8,3],表示一個8x8的圖像,有3個通道(R、G、B)。
  • 卷積核Shape:[kernel_height, kernel_width, in_channels, out_channels],即[3,3,3,5],表示一個3x3的卷積核,有3個通道(R、G、B),輸出通道數是5。
  • 輸出圖片Shape:[height, width, out_channels],即[6,6,5],表示一個6x6的輸出圖片,有5個通道(R、G、B)。
    out_height = (height - kernel_height + 1) / stride
    out_width = (width - kernel_width + 1) / stride

對于8x8的圖像和3x3的卷積核,輸出尺寸將是 (8 - 3 + 1) / 1 = 6,因此輸出形狀是 [6, 6, 5],表示一個6x6的特征圖,有5個輸出通道。

卷積核的輸入通道數(in_channels)由輸入圖像的通道數決定,比如:一個RGB格式的圖片,其輸入通道數為3。

而輸出矩陣的通道數(out_channels)是由卷積核的輸出通道數所決定,即卷積核有多少個不同的濾波器(filter)。在這個例子中,卷積核有5個濾波器,所以輸出有5個通道。

6.激活函數

并不是所有的映射關系都可以用線性關系準確表達。因此需要激活函數表示非線性映射。

激活函數也就是非線性映射。神經網絡如果僅僅是由線性運算堆疊,是無法形成復雜的表達空間的,也就很難提取高語義信息,因此需要加入非線性映射關系。

(1) Sigmoid函數

Sigmoid函數將特征壓縮到了(0,1)區間,0端是抑制狀態,1端是激活狀態,中間部分梯度最大。

(2) Relu函數

修正線性單元(Rectified Linear Unit, ReLU)。通常用于緩解梯度消失現象。

在小于0的部分,值與梯度為0,大于0導數為1,避免了Sigmoid函數中梯度接近于0導致的梯度消失問題。

(3) Softmax函數

多物體類別較為常用的分類器是Softmax函數。

在具體的分類任務中,Softmax函數的輸入往往是多個類別的得分,輸出則是每一個類別對應的概率,所有類別的概率取值都在0~1之間,且和為1。

Softmax函數公式如下:

其中,Vi表示第i個類別的得分,C代表分類的類別總數,輸出Si為第i個類別的概率。

CNN整體結構

卷積神經網絡CNN由輸入層、卷積層、Relu、池化層和全連接層、輸出層組成。

如下圖所示是一個卷積網絡示例,卷積層是卷積網絡的第一層,其后跟著其它卷積層或池化層,最后一層是全連接層。越往后的層識別圖像越大的部分,較早的層通常專注于簡單的特征(例如顏色和邊緣等)。隨著圖像數據在CNN中各層中前進,它開始識別物體的較大元素或形狀,直到最終識別出預期的物體。

其中:

  • 輸入層:接收原始圖像數據,作為網絡的輸入。
  • 卷積層:由濾波器filters和激活函數構成,屬于CNN的核心層,主要作用是提取樣本特征。它由輸入數據、filter(或卷積核)和特征圖組成。若輸入數據是RGB圖像,則意味著輸入將具有三個維度——高度、寬度和深度。filter的本質是一個二維權重矩陣,它將在圖像的感受野中移動,檢查特征是否存在。卷積的運算過程如上所述。卷積層一般要設置的超參數包括過濾器filters的數量、步長stride以及Padding的方式(valid or same)以及激活函數等。
  • 池化層:本質即就是下采樣(Downsampling),利用圖像局部相關性原理,對圖像進行子抽樣,在保留有用信息的前提下減小數據處理量,具有一定的防止模型過擬合作用。
  • 全連接層:該層的每一個結點與上一層的所有結點相連,用于將前邊提取到的特征綜合在一起。通常,全連接層的參數是最多的。
  • 輸出層:根據全連接層的信息得到概率最大的結果。

CNN的優勢

與傳統神經網絡相比CNN具有局部連接、權值共享等優點,使其學習的參數量大幅降低,且網絡的收斂速度也更快。

  • 局部連接:特征圖的每個輸出值不需要連接到輸入圖像中的每個像素值,而只需要連接到應用過濾器filter的感受野,因此卷積層通常被稱為“部分連接層”,這種特性也即是局部連接。
  • 權值共享:當卷積核在圖像上移動時,其權值是不變的。即為權值共享。
責任編輯:趙寧寧 來源: 小喵學AI
相關推薦

2024-11-15 13:20:02

2025-02-21 08:29:07

2024-09-20 07:36:12

2024-10-28 00:38:10

2024-10-05 23:00:35

2020-03-25 09:48:10

AI芯片神經網絡

2018-01-09 10:05:55

神經網絡ClojureCortex

2021-03-11 11:50:07

kafka服務器Java

2020-05-06 10:29:45

機器學習神經網絡TensorFlow

2017-05-04 18:30:34

大數據卷積神經網絡

2022-04-07 09:01:52

神經網絡人工智能

2014-10-08 10:42:08

萌碼編程

2019-01-05 08:40:17

VGG神經網絡

2019-11-19 08:00:00

神經網絡AI人工智能

2017-11-29 13:55:55

神經網絡循環神經網絡RNN

2022-10-11 23:35:28

神經網絡VGGNetAlexNet

2020-08-14 10:20:49

神經網絡人工智能池化層

2024-09-12 08:28:32

2024-10-17 13:05:35

神經網絡算法機器學習深度學習

2018-04-08 11:20:43

深度學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久草在线| 国产黄色大片在线观看 | 亚洲国产成人精品女人久久久 | 欧美最猛黑人xxxx黑人 | 色婷婷久久久亚洲一区二区三区 | 日本精品视频在线 | 夜夜操操操 | 三级免费网 | 国产精品一区二区福利视频 | 国产精品久久久久久亚洲调教 | 日韩精品一区二区三区中文字幕 | 国产成人一区二区三区久久久 | 欧美精品在线一区 | 亚洲 欧美 另类 日韩 | 亚洲在线 | 久久精品成人 | 蜜月aⅴ国产精品 | 国产精品欧美一区二区 | 一区二区三区视频在线观看 | 国产日韩精品视频 | 成人免费在线视频 | 欧美福利网站 | 日韩在线观看精品 | 九色.com| 中文字幕第一页在线 | 一级免费毛片 | 中文在线а√在线8 | 黄色大片观看 | 国产日韩欧美 | 国产高清免费 | 欧美成人精品在线观看 | 欧美亚洲视频在线观看 | 久久国产婷婷国产香蕉 | 99精品久久久久久久 | 99久9| 免费黄色a级毛片 | av在线一区二区三区 | 日韩精品一区二区三区老鸭窝 | 亚洲a在线观看 | 亚洲视频免费在线看 | 黄色成人亚洲 |