成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI「領悟」有理論解釋了!谷歌:兩種腦回路內部競爭,訓練久了突然不再死記硬背

人工智能
如為什么領悟所需的時間隨數據集大小的減小呈超指數級增長?為什么Cgen回路的學習速度慢?為什么在沒有權重衰減的情況下也會發生grokking?為什么在典型的機器學習訓練中沒有領悟現象?

谷歌PAIR團隊不久前撰文介紹了AI的“領悟” (Grokking)現象——

訓練久了突然不再死記硬背,而是學會舉一反三,有了泛化能力。

不出一個月,另一只團隊(主要成員來自DeepMind)表示,已經給出一個通用理論解釋——

領悟又稱延遲泛化,與AI內部兩種“腦回路”的競爭有關。

對此,有學者評價“我們需要更多這種對深度學習物理規律的研究,而不是去優化煉金術。”

AI的兩種腦回路

在先前的研究中,發現在“領悟”現象的作用下,就算只有5-24個神經元的模型也能擁有泛化能力。

新研究沿用了這種構建最小示例,以及大量做可視化的方法。

基于OpenAI在2020年一項對神經網絡內部機制之間相互作用的研究,團隊假設并驗證了模型內部有兩種算法回路(Circuits)。

  • 記憶回路Cmem,訓練時表現很好,但測試時表現不佳。
  • 泛化回路Cgen,訓練和測試階段表現都好。

通過改變數據集的大小和權重衰減的強度做實驗來觀察。

當訓練數據集增大時,Cmem回路的參數范數也更大,也就是在靠記憶的方式去存儲訓練集需要的信息量。

但Cgen的參數范數不隨訓練集大小變化,也就是獲得了類似“舉一反三”的泛化能力

那么,在什么條件下模型會發生整體的“領悟”現象呢?

來自兩種回路的之間競爭。

在訓練初期,直接死記硬背的速度更快,Cmem占據上風。

但隨著數據的增加,在梯度下降的作用下效率更高的Cgen會被加強。

也就是說,存在兩種不同的回路、他們之間有效率差和學習速度差是導致領悟發生的三大要素。

重新思考泛化

在更進一步的實驗中,團隊還根據這個理論成功演示了在一定條件下,已經“領悟”的模型也可以退化,出現“逆領悟”。

在新的小數據集上繼續訓練已領悟的模型時,測試精度突然變差,也就是在泛化之后的過擬合。

也可以精心調整出一個“半領悟”狀態。

當數據集的大小剛好在一個臨界值,讓Cmem和Cgen的效率相當,只對部分測試精度出現延遲泛化。

團隊認為,這種基于回路效率的分析為理解神經網絡的泛化提供了一種新的視角。

同時也提出了一些后續研究方向。

如為什么領悟所需的時間隨數據集大小的減小呈超指數級增長?為什么Cgen回路的學習速度慢?為什么在沒有權重衰減的情況下也會發生grokking?為什么在典型的機器學習訓練中沒有領悟現象?……

評論區有學者認為,研究這些基礎問題并不需要成千上萬塊H100。

GPU貧民也有機會為整個領域做出貢獻。

論文地址:https://arxiv.org/abs/2309.02390

參考鏈接:

[1]https://x.com/VikrantVarma_/status/1699823229307699305

[2]https://pair.withgoogle.com/explorables/grokking/

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-08-14 08:15:44

谷歌模型

2020-07-02 09:47:40

人工智能技術教育

2025-02-14 10:23:00

LLM模型谷歌

2017-09-21 11:43:14

JavascriptHtml5Html

2024-07-02 13:30:50

2025-06-18 08:51:00

數據生成AI模型

2024-07-23 09:26:20

2020-04-16 10:55:03

Java虛擬機字節碼

2025-06-26 15:16:42

AI獎勵模型GPT-4.1

2010-01-05 17:23:51

JSON建構

2010-07-19 14:07:09

Perl ->符號

2014-04-28 16:13:11

Unix目錄結構

2011-06-20 16:03:03

Qt 控件 鼠標

2021-02-24 13:51:45

BIMAI建筑技術

2021-07-26 14:14:40

VRAI人工智能

2022-05-26 23:14:26

原型原型鏈JS繼承

2022-06-07 10:28:53

云遷移云計算

2022-11-17 08:47:20

Go特性標準庫

2021-04-01 17:43:49

iOS 14.5蘋果Siri

2023-12-13 08:47:13

編程語言編譯型解釋型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线色网站 | 久久成人精品视频 | 国产黄a一级 | 羞羞视频网| 欧美多人在线 | 久久国内精品 | 狠狠干美女 | 国产一级片久久久 | 国产一区久久久 | 中文字幕三区 | 最新国产在线 | 亚洲欧美日韩精品 | 国产视频91在线 | 欧美一区2区三区4区公司二百 | 日日操夜夜操天天操 | 精品国产乱码久久久久久丨区2区 | 国产精品免费一区二区三区 | 亚洲在线一区二区三区 | 欧美又大粗又爽又黄大片视频 | 国产精品视频网 | 亚洲精品一 | 国产永久免费 | 成人免费黄色 | 亚洲一区二区三区观看 | 在线国产欧美 | 亚洲精品成人 | 欧美xxxx色视频在线观看免费 | 欲色av | 日韩插插| av免费观看网站 | 国产精品影视在线观看 | 黄色一级免费观看 | 一级中国毛片 | 4hu最新网址 | 久久手机在线视频 | 性色av一区二区三区 | 国产精产国品一二三产区视频 | 91在线一区| 天堂一区在线 | 99久久国产免费 | 日韩一区二区三区在线视频 |