成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="cgwsk"><source id="cgwsk"></source></li>

<button id="cgwsk"><tbody id="cgwsk"></tbody></button>

<strike id="cgwsk"></strike>

<abbr id="cgwsk"></abbr><rt id="cgwsk"></rt>

<bdo id="cgwsk"><source id="cgwsk"></source></bdo>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了

發(fā)布于 2024-5-6 09:17

瀏覽

0收藏

AI做數(shù)學(xué)題，真正的思考居然是暗中“心算”的？

紐約大學(xué)團隊新研究發(fā)現(xiàn)，即使不讓AI寫步驟，全用無意義的“……”代替，在一些復(fù)雜任務(wù)上的表現(xiàn)也能大幅提升！

一作Jacab Pfau表示：只要花費算力生成額外token就能帶來優(yōu)勢，具體選擇了什么token無關(guān)緊要。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

舉例來說，讓Llama 34M回答一個簡單問題：自然常數(shù)e的前6位數(shù)字中，有幾個大于5的？

AI直接回答約等于瞎搗亂，只統(tǒng)計前6位數(shù)字居然統(tǒng)計出7個來。

讓AI把驗證每一數(shù)字的步驟寫出來，便可以得到正確答案。

讓AI把步驟隱藏，替換成大量的“……”，依然能得到正確答案！

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

這篇論文一經(jīng)發(fā)布便掀起大量討論，被評價為“我見過的最玄學(xué)的AI論文”。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

那么，年輕人喜歡說更多的“嗯……”、“l(fā)ike……”等無意義口癖，難道也可以加強推理能力？

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

從“一步一步”想，到“一點一點”想

實際上，紐約大學(xué)團隊的研究正是從思維鏈（Chain-of-Thought，CoT）出發(fā)的。

也就是那句著名提示詞“讓我們一步一步地想”（Let‘s think step by step）。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

過去人們發(fā)現(xiàn)，使用CoT推理可以顯著提升大模型在各種基準(zhǔn)測試中的表現(xiàn)。

目前尚不清楚的是，這種性能提升到底源于模仿人類把任務(wù)分解成更容易解決的步驟，還是額外的計算量帶來的副產(chǎn)物。

為了驗證這個問題，團隊設(shè)計了兩個特殊任務(wù)和對應(yīng)的合成數(shù)據(jù)集：3SUM和2SUM-Transform。

3SUM要求從一組給定的數(shù)字序列中找出三個數(shù)，使得這三個數(shù)的和滿足特定條件，比如除以10余0。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

這個任務(wù)的計算復(fù)雜度是O(n³)，而標(biāo)準(zhǔn)的Transformer在上一層的輸入和下一層的激活之間只能產(chǎn)生二次依賴關(guān)系。

也就是說，當(dāng)n足夠大序列足夠長時，3SUM任務(wù)超出了Transformer的表達能力。

在訓(xùn)練數(shù)據(jù)集中，把與人類推理步驟相同長度的“...”填充到問題和答案之間，也就是AI在訓(xùn)練中沒有見過人類是怎么拆解問題的。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

在實驗中，不輸出填充token“…...”的Llama 34M表現(xiàn)隨著序列長度增加而下降，而輸出填充token時一直到長度14還能保證100%準(zhǔn)確率。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

2SUM-Transform僅需判斷兩個數(shù)字之和是否滿足要求，這在 Transformer 的表達能力范圍內(nèi)。

但問題的最后增加了一步“對輸入序列的每個數(shù)字進行隨機置換”，以防止模型在輸入token上直接計算。

結(jié)果表明，使用填充token可以將準(zhǔn)確率從 78.7%提高到93.6%。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

除了最終準(zhǔn)確率，作者還研究了填充token的隱藏層表示。實驗表明，凍結(jié)前面層的參數(shù)，只微調(diào)最后一個Attention層，隨著可用的填充token數(shù)量增多，預(yù)測的準(zhǔn)確率遞增。

這證實了填充token的隱藏層表示確實包含了與下游任務(wù)相關(guān)的隱性計算。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

AI學(xué)會隱藏想法了？

有網(wǎng)友懷疑，這篇論文難道在說“思維鏈”方法其實是假的嗎？研究這么久的提示詞工程，都白玩了。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

團隊表示，從理論上講填充token的作用僅限于TC⁰復(fù)雜度的問題范圍內(nèi)。

TC⁰也就是可以通過一個固定深度的電路解決的計算問題，其中電路的每一層都可以并行處理，可以通過少數(shù)幾層邏輯門（如AND、OR和NOT門）快速解決，也是Transformer在單此前向傳播中能處理的計算復(fù)雜度上限。

而足夠長的思維鏈，能將Transformer的表達能力擴展到TC⁰之外。

而且讓大模型學(xué)習(xí)利用填充token并不容易，需要提供特定的密集監(jiān)督才能收斂。

也就是說，現(xiàn)有的大模型不太可能直接從填充token方法中獲益。

但這并不是當(dāng)前架構(gòu)的內(nèi)在局限性，如果在訓(xùn)練數(shù)據(jù)中提供足夠的示范，它們應(yīng)該也能從填充符號中獲得類似的好處。

這項研究還引發(fā)了一個令人擔(dān)心的問題：大模型有能力進行無法監(jiān)控的暗中計算，對AI的可解釋性和可控性提出了新的挑戰(zhàn)。

換句話說，AI可以不依賴人類經(jīng)驗，以人們看不見的形式自行推理。

這既刺激又可怕。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

最后有網(wǎng)友開玩笑提議，讓Llama 3首先生成1千萬億點點點，就能得到AGI的權(quán)重了（狗頭）。

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了-AI.x社區(qū)

論文：???https://arxiv.org/abs/2404.15758??

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/--BxRKzWbGe-W3XODJtSMg??

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

更好、更安全、更不依賴OpenAI，微軟的AI新動向，推出大模型安全工具Azure AI

51CTO技術(shù)棧 ? 3111瀏覽 ? 0回復(fù)
更好、更安全、更不依賴OpenAI，微軟的AI新動向，推出大模型安全工具Azure AI

51CTO技術(shù)棧 ? 2839瀏覽 ? 0回復(fù)
CVPR 2024 Highlight | 基于單曝光壓縮成像，不依賴生成模型也能從單張圖像中重建三維場景

輕薄滴假象 ? 2886瀏覽 ? 0回復(fù)
Transformer在復(fù)雜推理任務(wù)中的新進展：多步邏輯推理中的匹配策略

xuxiangda ? 5715瀏覽 ? 0回復(fù)
AI畫連環(huán)畫角色更一致了！人物之間的復(fù)雜互動也能處理｜中山大學(xué)&聯(lián)想團隊出品

Crystalcxt ? 3841瀏覽 ? 0回復(fù)
不依賴特定模型的統(tǒng)一模型壓縮框架CPD發(fā)布

angel ? 2621瀏覽 ? 0回復(fù)
OpenAI 發(fā)布新模型 o1，能夠推理復(fù)雜任務(wù)，在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域更牛

AI洞察Insight ? 2689瀏覽 ? 0回復(fù)
Agent工作流記憶 - 讓AI助手更聰明地完成復(fù)雜任務(wù)

芝士AI吃魚 ? 3499瀏覽 ? 0回復(fù)
不依賴CUDA的大模型推理已經(jīng)實現(xiàn)

夜行神魚 ? 2800瀏覽 ? 0回復(fù)
OpenAI o1：用內(nèi)部思維鏈進行復(fù)雜推理

shizhi02 ? 2848瀏覽 ? 0回復(fù)
多智能體新進展 | 斯坦福大學(xué)提出新模型'Hypothetical Minds'，讓AI更懂人類思維

AI論文解讀 ? 3469瀏覽 ? 0回復(fù)
StaR ｜用少量推理數(shù)據(jù)讓模型學(xué)會通用推理能力，顯著提升模型復(fù)雜推理

arnoldzhw ? 3470瀏覽 ? 0回復(fù)
淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG

大模型自然語言處理 ? 2359瀏覽 ? 0回復(fù)
使用MCTS顯著提升LLM在復(fù)雜任務(wù)的推理能力

arnoldzhw ? 6819瀏覽 ? 0回復(fù)
混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)

大模型自然語言處理 ? 2589瀏覽 ? 0回復(fù)
Auto-RAG開源，復(fù)雜多跳問題就這么解決了！

PaperAgent ? 3507瀏覽 ? 0回復(fù)
Anthropic最新研究，Claude學(xué)會“演戲”了！

NLP前沿1 ? 2924瀏覽 ? 0回復(fù)
從0到1開發(fā)AI Agent | Plan-and-Execute 如何解決AI復(fù)雜任務(wù)

AI取經(jīng)路 ? 4418瀏覽 ? 0回復(fù)
如何讓AI自己學(xué)會更公平地打分？

石映飛云 ? 2126瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇： Sora大片真相：人工特效參與，被指誤導(dǎo)大眾

下一篇： CVPR‘24：與任務(wù)無關(guān)的多模態(tài)數(shù)據(jù)也能提升Transformer性能｜港中文&騰訊

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：婷婷久久综合 | 成人国产精品久久 | 欧美三级在线 | 伊人久久免费视频 | 国产91视频一区二区 | 精品国产乱码久久久久久影片 | 手机在线观看av | 狠狠干天天干 | 一区二区在线不卡 | 亚洲一区二区在线 | 一级视频在线免费观看 | 精品国产乱码久久久久久牛牛 | 365夜爽爽欧美性午夜免费视频 | 丝袜美腿一区二区三区 | 日韩精品久久一区 | 亚洲精品视频免费看 | 日日干日日射 | 欧美激情久久久 | 精品婷婷 | 免费成人毛片 | 亚洲自拍另类欧美丝袜 | 九一在线| 一区二区精品 | 亚洲综合无码一区二区 | 欧美一级久久 | 国产亚洲一区精品 | 91porn国产成人福利 | 欧美日韩三区 | 国产精品99久久久久久宅男 | 日韩免费在线视频 | 嫩草一区二区三区 | 伊人手机在线视频 | 成人深夜福利网站 | 成人一区二区在线 | 日韩在线中文 | 亚洲视频在线看 | 久久国产精品免费一区二区三区 | 久久久久久国产精品免费 | 成人美女免费网站视频 | 日韩精品在线观看一区二区 | 国产免费一区二区三区 |

<li id="6sc88"></li>

<code id="6sc88"></code><strike id="6sc88"><acronym id="6sc88"></acronym></strike>

<abbr id="6sc88"><source id="6sc88"></source></abbr>

<button id="6sc88"><input id="6sc88"></input></button>

<li id="6sc88"><source id="6sc88"></source></li>