成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

什么是神經網絡—終于把梯度下降搞明白了！

人工智能訓練營

發布于 2024-12-23 09:14

瀏覽

0收藏

什么是梯度下降？

梯度下降是一種用于優化目標函數的迭代算法。

什么是目標函數？

就是損失函數，損失函數（Loss Function）是在機器學習和深度學習中廣泛使用的一個概念。它主要用于衡量模型的預測結果與實際結果之間的差異程度。簡單來說，損失函數的值越小，說明模型的預測越準確。

例如，在一個回歸問題（比如預測房價）中，常用的損失函數是均方誤差（MSE）。假設真實房價是y ，模型預測的房價是y^，均方誤差損失函數可以表示為：

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

這里n是樣本數量。該函數通過計算每個樣本預測值和真實值差的平方的平均值，來衡量整體的誤差。我們的目標就是使得誤差降到最低，使預測值無限接近真實值，所以我們使用梯度下降來做到這一步。

梯度下降如何優化損失函數？

舉個例子來說明這一步，假設我們需要擬合一條直線，這條直線的橫坐標是體重，縱坐標是身高，如下所示（綠色的點是數據點，綠色的線是我們要擬合的線）：

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

這條直線的方程是y=w*x+b，三個數據坐標點的分別是(0.5,0.8),(2.5,2),(3,3)。我們先求出損失函數，這個損失函數才是我們要優化的參數。我們使用MSE作為損失函數。

得到損失函數Loss=((0.8-w*0.5-b)平方+(2-w*2.5-b)平方+(3-w*3-b)平方)/3。

我們可以看到損失函數Loss就是關于w和b兩個參數的函數。我們將Loss函數的圖像畫出來如下圖所示：

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

上面的圖片中x軸是w，y軸是b，z軸是Loss。我們要找的就是Loss處于最低點處的w和b的值。

那我們怎么找呢？

就要使用梯度下降。梯度就是導數，就是參數在某一點的變化率，在曲線上可以反映為某一點的切線。對于多元函數來說，梯度就是一個向量，它包含了函數對各個向量的偏導數，這個梯度的向量指向函數值增長最快的方向。我們知道導數為0時，函數處于極值點。所以我們沿著梯度下降就可以最快的到達損失函數極小值點。

梯度下降的做法就是損失函數分別對參數求導，比如說當w為固定值時，損失函數Loss對b的函數圖像如下所示，圖片中的斜率時Loss對b的導數，也就是b的梯度：

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

當b=0時，Loss很大，梯度(斜率)很大。

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

當b=0.8時，Loss趨近最小值，梯度(斜率)很小。

由此我們可以看到，當斜率也就是梯度很大的時候，b可以增大一點步長，以便于快速到達極值點；當斜率也就是梯度很小的時候說明很快逼近最小值，b可以減小一點步長；所以b可以這樣更新：

b=b-（Loss對b的梯度）*學習率

梯度大的時候b就可以邁大一步，梯度小的時候b就可以邁小一步，這里學習率一般設置比較小，避免邁的步子太大直接跳過極小值點。

所以梯度下降的步驟一般如下所示：

1. 對損失函數中每個參數求導，也就是求梯度

2. 對參數隨機賦值

3. 將參數值帶入梯度

4. 計算步長

5. 更新參數

6. 回到步驟3重新計算，直到步長（（Loss對b的梯度）*學習率）小于設置閾值。

怎么樣？看上去很晦澀的東西是不是也沒那么難懂？是不是對梯度下降非常了解了？！

什么是神經網絡—終于把梯度下降搞明白了！-AI.x社區

本文轉載自 ??人工智能訓練營??，作者：小A學習

標簽

已于2024-12-23 09:17:53修改

贊

收藏

回復

舉報

回復

相關推薦

在神經網絡中實現反向傳播

mb61e52f0ac174a ? 2666瀏覽 ? 0回復
神經網絡的通用訓練流程

AI探索時代 ? 2992瀏覽 ? 0回復
你知道神經網絡是怎么運作的嗎？神經網絡內部原理解析

AI探索時代 ? 2803瀏覽 ? 0回復
神經網絡與2024諾貝爾物理獎

魯班模錘1 ? 2493瀏覽 ? 0回復
優雅談大模型：神經網絡與矩陣

魯班模錘1 ? 2548瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了！

人工智能訓練營 ? 2089瀏覽 ? 0回復
什么是神經網絡？神經網絡開發框架——PyTorch和架構Transformer的區別和聯系

AI探索時代 ? 3019瀏覽 ? 0回復
神經網絡是怎么學習的？

AI探索時代 ? 2044瀏覽 ? 0回復
關于神經網絡的輸入格式——數據集的處理，關于神經網絡模型的結構說明

AI探索時代 ? 2395瀏覽 ? 0回復
神經網絡之損失函數與優化函數——梯度下降

AI探索時代 ? 2423瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了反向傳播詳解

人工智能訓練營 ? 2341瀏覽 ? 0回復
從一個簡單的神經網絡模型開始

AI探索時代 ? 1971瀏覽 ? 0回復
再談什么是神經網絡，透過現象看本質

AI探索時代 ? 1945瀏覽 ? 0回復
怎么實現一個神經網絡？神經網絡的組成結構

AI探索時代 ? 2118瀏覽 ? 0回復
不同神經網絡之間的區別，僅僅只是網絡結構的不同，明白了這個你才能知道應該怎么學習神經網絡

AI探索時代 ? 2172瀏覽 ? 0回復
神經網絡的每一層都是干嘛的？這才是神經網絡結構的核心

AI探索時代 ? 2093瀏覽 ? 0回復
什么是神經網絡-循環神經網絡RNN各層詳解及實例展示

人工智能訓練營 ? 2565瀏覽 ? 0回復
什么是神經網絡：反向傳播如何更新網絡參數

人工智能訓練營 ? 1075瀏覽 ? 0回復
神經網絡為什么可以分類和回歸--為何智能

人工智能訓練營 ? 566瀏覽 ? 0回復

人工智能訓練營

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

多元線性回歸超詳細講解 18h前發布
LSTM詳解，你學會了嗎？ 18h前發布

熱門推薦

XGboost算法詳解(原理+公式推導) 0回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

下一篇：什么是神經網絡-終于把神經網絡參數更新搞明白了！

社區精華內容

目錄

主站蜘蛛池模板：电影午夜精品一区二区三区 | 久久国产精品-久久精品 | 美国av毛片| 亚洲国产精品久久久久婷婷老年 | 欧美一级特黄aaa大片在线观看 | 国产欧美一区二区三区日本久久久 | 亚洲综合色网站 | 欧美激情在线观看一区二区三区 | 欧美日韩一区二区三区在线观看 | 欧美亚洲另类在线 | 成人免费在线网 | 久久久久久久久久久久久久国产 | 中文字幕一区二区三区四区五区 | 精品日韩一区 | 国产一区二区三区亚洲 | 东方伊人免费在线观看 | 欧美一区二区三区在线看 | av一区二区三区在线观看 | 国产视频福利一区 | 亚洲视频免费在线观看 | .国产精品成人自产拍在线观看6 | 亚洲一区视频在线 | 一区二区三区欧美 | 久久久精 | 日日日干干干 | a在线观看免费 | 亚洲精彩视频在线观看 | 色视频在线观看 | 国产免费a视频 | 国产黄色网址在线观看 | 欧美一级黄色片免费观看 | www.日本在线观看 | 日韩欧美国产一区二区三区 | 99精品99久久久久久宅男 | 欧美精品一区三区 | 成人二区 | 操久久 | 在线视频一区二区三区 | 欧美一级久久 | 91热爆在线观看 | 日韩欧美二区 |

<samp id="ue44s"><bdo id="ue44s"></bdo></samp>

<center id="ue44s"><xmp id="ue44s"></xmp></center>