成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

推理模型新路線開源!與DeepSeek截然不同,拋棄思維鏈不用人類語言思考

人工智能 新聞
拋棄長思維鏈和人類的語言,直接在連續(xù)的高維潛空間用隱藏狀態(tài)推理,可自適應(yīng)地花費(fèi)更多計(jì)算來思考更長時(shí)間。

開源推理大模型新架構(gòu)來了,采用與Deepseek-R1/OpenAI o1截然不同的路線

拋棄長思維鏈和人類的語言,直接在連續(xù)的高維潛空間用隱藏狀態(tài)推理,可自適應(yīng)地花費(fèi)更多計(jì)算來思考更長時(shí)間。

例如問題:Claire每天早餐都會(huì)做一個(gè)3個(gè)雞蛋的煎蛋卷。她在4周內(nèi)會(huì)吃多少個(gè)雞蛋?

從新模型Huginn的思考軌跡可視化中,可以看到對(duì)數(shù)字3等重要token不斷旋轉(zhuǎn),最終收斂到正確答案對(duì)應(yīng)的位置,但在不關(guān)鍵的人物名字Cla-ire上沒有這個(gè)現(xiàn)象。

除旋轉(zhuǎn)之外還能觀察到更多豐富的幾何模式,研究團(tuán)隊(duì)認(rèn)為這表明該模型正在獨(dú)立學(xué)習(xí)利用潛空間的高維性質(zhì)以新的方式做推理

由于不使用長思維鏈推理范式,新方法還有幾個(gè)額外優(yōu)勢(shì):

  • 不需要任何專門的訓(xùn)練數(shù)據(jù)
  • 可以在很小的上下文窗口下工作
  • 能捕捉到難以用語言表達(dá)的推理類型

研究來自馬克思普朗克研究所、馬里蘭大學(xué)等團(tuán)隊(duì),他們使用美國橡樹嶺實(shí)驗(yàn)室的Frontier超算完成訓(xùn)練實(shí)驗(yàn),用到8個(gè)AMD GPU節(jié)點(diǎn)(4096塊GPU),沒有使用英偉達(dá)體系。

新架構(gòu)給Transformer加入循環(huán)模塊

新架構(gòu)仍然圍繞Decoder-only的Transformer block構(gòu)建,但分為三段:

  • Prelude(前奏):使用多個(gè)transformer層將輸入數(shù)據(jù)嵌入到潛空間中
  • Recurrent Block(循環(huán)塊):循環(huán)計(jì)算單元,在潛在空間中修改狀態(tài)
  • Coda(尾聲):從潛空間解碼,并包含模型的預(yù)測(cè)頭

在訓(xùn)練期間為每個(gè)輸入序列分配隨機(jī)數(shù)量的迭代次數(shù)。同時(shí)為了在訓(xùn)練時(shí)保持較低的計(jì)算和內(nèi)存,只反向傳播循環(huán)單元的最后k次迭代。

研究中可視化了模型在潛在空間中的推理軌跡,發(fā)現(xiàn)了這些有趣現(xiàn)象:

  • 對(duì)一些簡(jiǎn)單token,模型的隱狀態(tài)會(huì)快速收斂到穩(wěn)定點(diǎn)
  • 但對(duì)一些關(guān)鍵token,如數(shù)學(xué)問題中的數(shù)字”3”,隱狀態(tài)會(huì)形成復(fù)雜的圓形軌道
  • 還有一些token的隱狀態(tài)會(huì)沿特定方向”滑動(dòng)”,可能用于計(jì)數(shù)循環(huán)次數(shù)

論文一作Jonas Geiping透露,他們的算力只夠一次大規(guī)模訓(xùn)練,也就是最后發(fā)布的3.5B參數(shù)的Huginn模型,在800B tokens數(shù)據(jù)上預(yù)訓(xùn)練。

沒有post/mid-training過程,但可以與7B參數(shù)、在2-3T tokens數(shù)據(jù)上訓(xùn)練的開源模型能力相匹配。

另外算上循環(huán)模塊中的計(jì)算,3.5B參數(shù)的模型訓(xùn)練時(shí)的計(jì)算量相當(dāng)于傳統(tǒng)的32B模型。

有人猜測(cè)OpenAI o3使用了類似的方法,通過循環(huán)來達(dá)到近似無限上下文,并且控制高中低三種推理時(shí)間設(shè)置。

有OpenAI研究員已經(jīng)注意到這個(gè)工作,把論文讀完了還在線捉bug。

也已經(jīng)有人準(zhǔn)備根據(jù)DeepSeek-R1開源的方法嘗試新思路,同時(shí)保留潛空間思考的推理能力,和CoT思考的可讀性。

論文:https://arxiv.org/abs/2502.05171
模型:https://huggingface.co/tomg-group-umd/huginn-0125
代碼:https://github.com/seal-rg/recurrent-pretraining

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2011-09-05 10:18:21

Windows 8Mac OS

2012-01-16 09:01:40

CIO云計(jì)算

2011-08-12 09:29:52

2025-03-17 08:15:00

AI技術(shù)模型

2025-05-28 02:40:00

AdaptThink推理模型AI

2018-06-20 11:16:12

NVIDIA顯卡架構(gòu)

2025-03-13 12:44:56

2023-02-13 09:01:21

2021-04-26 15:10:41

比特幣DeFi金融

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-03-07 11:06:06

大型語言模型AICoD

2010-10-29 10:45:02

GrailsGroovy

2025-02-17 14:43:51

2025-01-15 13:01:07

2014-03-16 22:49:29

SAPd-codeSAP HANA

2009-04-23 17:49:12

AMD四核服務(wù)器

2025-03-05 00:22:00

2025-03-11 08:50:00

2025-07-01 09:08:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 欧美日韩国产精品激情在线播放 | www.国产| 91中文字幕在线观看 | 一级黄色大片 | 91www在线观看| 黄a网站| 99免费| 国产一区二区三区精品久久久 | 污免费网站| 日韩欧美大片在线观看 | 999久久久国产精品 欧美成人h版在线观看 | 激情一区 | 婷婷在线视频 | 97超碰在线播放 | 免费视频一区二区 | 国产亚洲欧美日韩精品一区二区三区 | 国产精品国产a | 中文字幕一区在线观看视频 | 国产97视频在线观看 | 精品一区二区三区四区五区 | 黄色免费在线观看 | 欧美九九九 | 日本不卡免费新一二三区 | 欧美一级视频免费看 | 蜜月aⅴ国产精品 | 国产视频久久 | 日韩中文字幕在线视频 | 成人激情免费视频 | 56pao在线| 欧美日韩国产一区二区 | 国产欧美一区二区三区久久手机版 | 日韩国产精品一区二区三区 | 欧美一级毛片免费观看 | 久久精品亚洲精品 | 日韩av一区二区在线观看 | 在线免费观看亚洲 | 一区二区精品 | 中文字幕成人在线 | 在线精品一区 | 成人视屏在线观看 | 国产精品亚洲视频 |