成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化

發(fā)布于 2025-6-23 07:28

瀏覽

0收藏

這兩天重讀了一篇很有趣的論文，《Effect of the initial configuration of weights on the training and function of artificial neural networks》（ https://arxiv.org/pdf/2012.02550 ）。它非常直白的展示了人工神經(jīng)網(wǎng)絡訓練過程中的初始權(quán)重配置對網(wǎng)絡功能和性能的影響。

通俗來講，神經(jīng)網(wǎng)絡就像是一臺復雜的機器，它內(nèi)部有很多“開關(guān)”（也就是權(quán)重），這些開關(guān)從一開始就有隨機的初始設置。在訓練過程中，這些開關(guān)的設置會一點一點調(diào)整，目標是讓網(wǎng)絡最終能夠給出盡量準確的輸出。

作者通過分析發(fā)現(xiàn)，在使用常見的訓練方法（SGD/AdamW等）時，網(wǎng)絡的最終狀態(tài)通常不會離初始設置太遠。這就好比網(wǎng)絡的學習是在“微調(diào)”初始狀態(tài)，而不是完全重置或重新安排所有開關(guān)。

訓練算法通常不需要走到離初始設置太遠的地方，在初始設置的周圍就能找到理想的解。

受論文思路的啟發(fā)，我做了一個實驗，來觀察上述現(xiàn)象。( 詳細完整的代碼在 https://github.com/zhangfaen/effect-of-the-initial-configuration-of-weights )。

我們定義一個簡單的多層神經(jīng)網(wǎng)絡。

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

其中nn.Linear(128, 128)這個參數(shù)矩陣，是隨機初始化的。我們制作一個分辨率圖片是128*128的圖片，圖片中我們故意放了一個水印（“中”）字。

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

圖1

然后，我們把這個圖片疊加到nn.Linear(128, 128)這個參數(shù)矩陣中。

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

我們把這個參數(shù)矩陣當一個圖片看的話，會是這個樣子：

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

圖2

然后，我們用著名的手寫字符識別數(shù)據(jù)集來訓練這個模型。

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

訓練完成后，我們再用圖片的方式看一下nn.Linear(128, 128)這個參數(shù)矩陣，如圖3。

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

圖3

可以看到，模型從最初的8.92%準確率（就是隨機猜的準確率），到95.77%的準確率，nn.Linear(128, 128)這個參數(shù)矩陣居然沒有什么大的變化（看圖2 和圖3）。

下面的圖中第1行，10個“中”字，表示訓練過程10個epoch中，這個nn.Linear(128, 128)這個參數(shù)矩陣的整體數(shù)值如何在變（其實沒怎么變）

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

所以，一個深度神經(jīng)網(wǎng)絡模型，初始參數(shù)配置不管怎樣，從“白癡”訓練到“專家”水平，其實其內(nèi)部參數(shù)并沒有太大的變化。是不是有點 “朽木皆可雕也” 或者 “開局一把牌，怎么都能打”的意思？

再感受一下論文中的圖和一個論述，啟發(fā)且有趣

開局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡從“白癡”訓練到“專家”水平，其參數(shù)并沒有太大的變化-AI.x社區(qū)

本文轉(zhuǎn)載自??后向傳播??，作者：張發(fā)恩

標簽

神經(jīng)網(wǎng)絡

已于2025-6-23 10:35:52修改

贊

收藏

回復

舉報

回復

相關(guān)推薦

ICLR 2024 Oral｜用巧妙的「傳送」技巧，讓神經(jīng)網(wǎng)絡的訓練更加高效

輕薄滴假象 ? 2587瀏覽 ? 0回復
神經(jīng)網(wǎng)絡的通用訓練流程

AI探索時代 ? 2999瀏覽 ? 0回復
你知道神經(jīng)網(wǎng)絡是怎么運作的嗎？神經(jīng)網(wǎng)絡內(nèi)部原理解析

AI探索時代 ? 2820瀏覽 ? 0回復
手把手從零構(gòu)建神經(jīng)網(wǎng)絡

Syrupup ? 2417瀏覽 ? 0回復
優(yōu)雅談大模型：神經(jīng)網(wǎng)絡與矩陣

魯班模錘1 ? 2553瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡—終于把梯度下降搞明白了！

人工智能訓練營 ? 2369瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-終于把神經(jīng)網(wǎng)絡參數(shù)更新搞明白了！

人工智能訓練營 ? 2109瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡？神經(jīng)網(wǎng)絡開發(fā)框架——PyTorch和架構(gòu)Transformer的區(qū)別和聯(lián)系

AI探索時代 ? 3028瀏覽 ? 0回復
神經(jīng)網(wǎng)絡是怎么學習的？

AI探索時代 ? 2050瀏覽 ? 0回復
怎么學習設計和訓練一個大模型——也就是神經(jīng)網(wǎng)絡？

AI探索時代 ? 2014瀏覽 ? 0回復
關(guān)于神經(jīng)網(wǎng)絡的輸入格式——數(shù)據(jù)集的處理，關(guān)于神經(jīng)網(wǎng)絡模型的結(jié)構(gòu)說明

AI探索時代 ? 2410瀏覽 ? 0回復
關(guān)于神經(jīng)網(wǎng)絡的一些思考與感受

AI探索時代 ? 1980瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-終于把神經(jīng)網(wǎng)絡參數(shù)更新搞明白了反向傳播詳解

人工智能訓練營 ? 2354瀏覽 ? 0回復
從一個簡單的神經(jīng)網(wǎng)絡模型開始

AI探索時代 ? 1973瀏覽 ? 0回復
怎么實現(xiàn)一個神經(jīng)網(wǎng)絡？神經(jīng)網(wǎng)絡的組成結(jié)構(gòu)

AI探索時代 ? 2134瀏覽 ? 0回復
不同神經(jīng)網(wǎng)絡之間的區(qū)別，僅僅只是網(wǎng)絡結(jié)構(gòu)的不同，明白了這個你才能知道應該怎么學習神經(jīng)網(wǎng)絡

AI探索時代 ? 2185瀏覽 ? 0回復
神經(jīng)網(wǎng)絡的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡結(jié)構(gòu)的核心

AI探索時代 ? 2098瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-循環(huán)神經(jīng)網(wǎng)絡RNN各層詳解及實例展示

人工智能訓練營 ? 2595瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡：反向傳播如何更新網(wǎng)絡參數(shù)

人工智能訓練營 ? 1075瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

聊聊背后的技術(shù) | AI+生物 | 突破進展，世界上首次開發(fā)出“為一人定制”的CRISPR基因編輯體內(nèi)治療藥物 2025-06-10 06:59:33發(fā)布
好馬配好鞍，好模配指南 | Claude 4發(fā)布了，業(yè)界反響很好，其行為指南“系統(tǒng)提示詞”也被全文公開 2025-05-28 06:22:20發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

AI Agents開源工具棧全解析~ 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復

圖像編輯革命！FLUX.1 Kontext [dev]震撼開源：挑戰(zhàn)GPT-4o的圖像編輯 0回復

上一篇：聊聊背后的技術(shù) | AI+生物 | 突破進展，世界上首次開發(fā)出“為一人定制”的CRISPR基因編輯體內(nèi)治療藥物

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：亚洲一区二区三区久久久 | 日本国产精品视频 | 综合五月婷 | www.亚洲视频| 亚洲成人一区二区 | 超碰国产在线 | 日韩有码在线观看 | 久久亚洲经典 | 欧美寡妇偷汉性猛交 | 色视频一区二区 | 九九久久国产 | 青草福利| 91精品国产91久久久久久三级 | 国户精品久久久久久久久久久不卡 | 久久久免费电影 | 台湾a级理论片在线观看 | 欧美精品区 | 欧美一区二区三区在线 | 精品欧美一区二区三区久久久 | 日韩一区二区三区在线看 | 欧美在线a | 国产精品伦一区二区三级视频 | www.一级毛片| 日韩精品电影一区亚洲 | 久久美国 | 国产精品一区二区久久精品爱微奶 | 一区二区在线不卡 | 99久久中文字幕三级久久日本 | 亚洲午夜av久久乱码 | 国产精品久久 | www.亚洲国产精品 | 在线一区二区国产 | 日韩免费av | 麻豆hd| 亚洲国产精品一区二区三区 | 特黄色一级毛片 | 亚洲播放 | 一区二区三区四区不卡视频 | 一区二区久久 | 伊人伊人伊人 | 欧美激情在线精品一区二区三区 |