成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

擴散語言模型寫代碼!速度比自回歸快10倍

人工智能 新聞
Inception Labs推出基于擴散技術的全新商業級大語言模型——Mercury。

誰說擴散模型只能生成圖像和視頻?

現在它們能高質量地寫代碼了,速度還比傳統大模型更快!

Inception Labs推出基于擴散技術的全新商業級大語言模型——Mercury

圖片

Mercury突破了自回歸模型 “從左到右” 逐詞生成的限制,采用 “從噪聲到結構化輸出” 的方式,能一次性預測所有方向的token,提高了生成速度。

這樣一來,Mercury還解決了自回歸“一旦生成難以回頭調整”的問題。

擴散模型并不是僅考慮前面已經生成的內容,它能在生成過程中進行動態糾錯修改,具有更大的靈活性。

圖片

盡管采用了擴散技術,Mercury模型系列仍保留了Transformer架構。

這確保了該模型能直接復用近年來為大語言模型開發的高效訓練、推理優化技術(如低階算子優化、超參數調優工具等)。

實測數據顯示,面對相同的編程任務,Mercury的代碼生成速度比傳統工具最多快10倍,大幅縮短了開發周期。

在H100 GPU上實現1109 tokens/秒吞吐量

Mercury用成熟的Transformer作為神經網絡基礎,結合擴散技術的并行生成能力,既保留了大模型的兼容性,又突破了自回歸模型逐詞生成的速度限制。

圖片

擴散生成流程

Mercury的核心創新在于 “擴散式生成”,流程如下:

  1. 訓練階段的正向過程:從真實文本(如代碼片段)出發,逐步加入噪聲(隨機替換、刪除token等),最終變成完全隨機的噪聲序列。
  2. 推理階段的反向過程(核心):從隨機噪聲開始,通過Transformer模型迭代優化,逐步去除噪聲,最終生成符合真實分布的文本。每次迭代中,模型會并行修改多個token,而非逐詞生成。

這一過程擴展了此前的離散擴散方法,通過優化數據處理和計算邏輯,實現了大規模訓練(萬億級token)。

高效利用硬件

Mercury主要通過并行化文本生成、動態去噪調度、混合精度量化等技術,極致發揮GPU性能,實現對硬件的高效利用,降低訓練和推理成本。

  • 并行化文本生成

擴散機制允許模型在單次前向傳播中預測多個token,相較于自回歸模型的“從左到右”逐詞生成,顯著提升了GPU利用率。

NVIDIA H100 GPU上,Mercury Coder Mini和Mercury Coder Small(Mercury Coder系列編碼優化產品)分別實現了1109 tokens/秒737 tokens/秒的吞吐量。

圖片

在Copilot Arena的基準測試中,可將響應時間壓縮至其他工具的1/4,同時硬件資源占用減少60%。

圖片

  • 動態去噪調度算法

Mercury通過自適應調整去噪步數,在簡單任務中減少計算量,在復雜任務中保留足夠迭代次數,實現精度與效率的平衡,從而更高效地利用硬件資源,避免不必要的計算開銷。

  • 混合精度量化技術

模型在推理時可自動切換至低精度計算模式,內存占用減少30%,同時通過殘差補償機制維持輸出質量。這讓Mercury能在有限的硬件內存條件下運行,且不明顯影響性能。

強大的錯誤糾正能力

與傳統自回歸模型 “從左到右” 逐詞生成,一旦生成難以回頭調整不同,Mercury不受限于僅考慮前面已生成的內容,能夠在生成過程中動態修改之前的內容,具有更大的靈活性。

  • 雙向注意力機制Mercury在去噪過程中引入上下文雙向關聯,能夠更好地理解文本的前后語境,從而更準確地發現和糾正錯誤。
  • 實時糾錯模塊模型在去噪步驟中會同步檢測代碼邏輯漏洞,通過強化學習動態修正輸出。在代碼生成任務中,Mercury Coder可以自動修正邏輯漏洞,還支持函數級參數自動校正,能有效提高代碼的準確性和可用性。
  • 多語言語法樹嵌入Mercury將Python、Java等語言的抽象語法樹(AST)結構融入擴散過程,有助于減少語法錯誤。

圖片

超快響應速度與當前CI能力不匹配

在LLMs出現之前,持續集成/交付(CI/CD)的速度就已經成為一個主要瓶頸,這導致開發人員在測試時把時間浪費在等待拉取請求(PRs)上。

有時,一個更改操作需要在隊列中等待數小時,甚至有時會因為不穩定需要重新開始。

Mercury模型在編寫代碼方面實現了超高速響應,但如果每次代碼更改都需要數小時進行測試,那么就像這位網友提出的問題一樣:

即使大模型能夠以比人類快100倍的速度寫代碼,但測試速度跟不上的話,這將沒有什么意義。

圖片

于是問題來了:

如何緩解超快響應速度與當前CI能力不匹配的問題?

一些人認為因為開發人員時間比機器時間昂貴得多,所以可以通過簡單地“投入更多機器”來解決CI速度問題。

圖片

然而,也有另一些人指出,這對于谷歌等“印鈔機”公司可能可行,但對于普通公司來說,CI預算是固定的,增加計算資源并不是一件容易的事情。

Inception Labs團隊

Mercury的開發方Inception Labs的三位聯合創始人是來自斯坦福、UCLA和康奈爾大學的計算機教授。

其中,Stefano Ermon是擴散模型的共同發明人,他與Sohl-Dickstein等學者共同構建了擴散模型的理論基礎,并通過后續研究推動了模型的實用化。

圖片

另一位創始人Aditya Grover曾在Meta FAIR擔任研究科學家。

攻讀博士學位期間,他先后在谷歌DeepMind、微軟研究院和OpenAI實習。

圖片

Volodymyr Kuleshov曾在2018年獲得Arthur Samuel最佳論文獎。

圖片

該團隊包括來自Google DeepMind、微軟、Meta、OpenAI和NVIDIA的資深人士,目前正專注于用擴散技術改進大模型性能。

Inception Labs還開放了Mercury模型的在線體驗平臺。

圖片

感興趣的朋友可點擊下方鏈接體驗~

論文地址:https://arxiv.org/abs/2506.17298Mercury

在線體驗平臺:https://chat.inceptionlabs.ai/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-27 15:28:11

模型訓練AI

2024-04-26 12:51:48

2023-04-07 08:17:39

fasthttp場景設計HTTP

2021-03-08 09:05:47

數據傳輸新線纜數據中心

2023-10-25 18:53:45

芯片AI芯片

2025-06-11 09:21:28

2025-06-11 14:39:50

AILLMMistral

2022-11-02 08:12:47

TurbopackVite

2021-06-11 09:21:20

開源SQL Parser詞法語法分析器

2009-07-01 09:47:10

FireFox 3.5瀏覽

2022-03-19 10:26:48

Linuxapt 命令

2025-03-25 12:44:24

2025-04-15 09:24:00

芯片AI技術

2011-06-29 09:31:58

3G4G5G

2024-02-20 13:31:26

AI訓練

2015-01-16 10:43:09

WiGigWiFi

2022-10-27 08:31:31

架構

2025-05-30 15:52:05

訓練代碼推理

2023-12-18 09:36:36

模型研究

2025-02-27 13:45:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产99精品 | 欧美日韩一区精品 | 色综合视频 | 在线免费国产 | 91精品国产一区二区三区动漫 | 国产一区二区毛片 | 国产一区二区三区亚洲 | 国产羞羞视频在线观看 | 精品成人 | 99精品电影| 久草中文在线 | 夜夜爆操 | 亚洲av一级毛片 | 国产一区二区在线免费观看 | 91视频在线 | 二区欧美| 国产精品自拍视频网站 | 成人在线精品视频 | 亚洲一区二区三区在线 | 日本电影韩国电影免费观看 | 97精品久久 | 在线视频一区二区 | 天堂色 | 亚洲精彩视频 | 欧美综合一区二区三区 | 国产免费观看一级国产 | 超碰伊人久久 | 欧美精品乱码久久久久久按摩 | 亚洲精品在线看 | 色婷婷综合久久久久中文一区二区 | 精品视频成人 | 久久新视频 | 蜜桃av一区二区三区 | 日韩欧美一区二区三区 | 国产精品一区二区免费 | 欧美成人视屏 | 亚洲精品三级 | 国产一区二区精品在线观看 | 成人免费视频观看视频 | 99在线资源 | 国产精品激情小视频 |