成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Uni-3DAR用自回歸統(tǒng)一微觀與宏觀的3D世界,性能超擴(kuò)散模型256%,推理快21.8倍

人工智能 新聞
它名為 Uni-3DAR,來(lái)自深勢(shì)科技、北京科學(xué)智能研究院及北京大學(xué),是一個(gè)通過(guò)自回歸下一 token 預(yù)測(cè)任務(wù)將 3D 結(jié)構(gòu)的生成與理解統(tǒng)一起來(lái)的框架。

從微觀世界的分子與材料結(jié)構(gòu)、到宏觀世界的幾何與空間智能,創(chuàng)建和理解 3D 結(jié)構(gòu)是推進(jìn)科學(xué)研究的重要基石。3D 結(jié)構(gòu)不僅承載著豐富的物理與化學(xué)信息,也可為科學(xué)家提供解構(gòu)復(fù)雜系統(tǒng)、進(jìn)行模擬預(yù)測(cè)和跨學(xué)科創(chuàng)新的重要工具。如何準(zhǔn)確且高效地構(gòu)建 3D 模型、理解和生成 3D 世界正在成為 AGI、AI for Science、具身智能三大 AI 熱門領(lǐng)域共同關(guān)注的焦點(diǎn)。而隨著 AI 技術(shù)的發(fā)展,大型語(yǔ)言模型(LLM)與大型多模態(tài)模型(LMM)那強(qiáng)大的自回歸下一 token 預(yù)測(cè)能力也已經(jīng)在開始被用于創(chuàng)建和理解 3D 結(jié)構(gòu)。基于此,我們看到了 AI for Science 的新可能。

近日,一個(gè)開創(chuàng)性的此類大模型誕生了!

它名為 Uni-3DAR,來(lái)自深勢(shì)科技、北京科學(xué)智能研究院及北京大學(xué),是一個(gè)通過(guò)自回歸下一 token 預(yù)測(cè)任務(wù)將 3D 結(jié)構(gòu)的生成與理解統(tǒng)一起來(lái)的框架。據(jù)了解,Uni-3DAR 是世界首個(gè)此類科學(xué)大模型。并且其作者陣容非常強(qiáng)大,包括了深勢(shì)科技 AI 算法負(fù)責(zé)人柯國(guó)霖、中國(guó)科學(xué)院院士鄂維南、深勢(shì)科技創(chuàng)始人兼首席科學(xué)家和北京科學(xué)智能研究院院長(zhǎng)張林峰等。

柯國(guó)霖在 ?? 上分享表示:Uni-3DAR 的核心是一種通用的粗到細(xì) token 化方法(coarse-to-fine tokenization),它能將 3D 結(jié)構(gòu)轉(zhuǎn)化為一維的 token 序列。

圖片

圖片

  • 論文標(biāo)題:Uni-3DAR: Unified 3D Generation and Understanding via Autoregression on Compressed Spatial Tokens
  • 論文地址:https://arxiv.org/abs/2503.16278
  • 項(xiàng)目主頁(yè):https://uni-3dar.github.io
  • 代碼倉(cāng)庫(kù):https://github.com/dptech-corp/Uni-3DAR

基于這套通用的 token 化方法,Uni-3DAR 使用自回歸的方式,統(tǒng)一了 3D 結(jié)構(gòu)的生成和理解任務(wù)。大量實(shí)驗(yàn)表明,Uni-3DAR 在分子生成、晶體結(jié)構(gòu)生成與預(yù)測(cè)、蛋白結(jié)合位點(diǎn)預(yù)測(cè)、分子對(duì)接和分子預(yù)訓(xùn)練等多個(gè)任務(wù)中均取得了領(lǐng)先性能。尤其在生成任務(wù)中,相較于現(xiàn)有的擴(kuò)散模型,其性能實(shí)現(xiàn)了高達(dá) 256% 的相對(duì)提升,推理速度提升達(dá) 21.8 倍,充分驗(yàn)證了該框架的有效性與高效性。此外,此模型不僅可以用在微觀的 3D 分子,也可以用到宏觀的 3D 任務(wù)上,具備跨尺度的能力。

具體來(lái)說(shuō),Uni-3DAR 解決了 3D 結(jié)構(gòu)建模里的兩個(gè)痛點(diǎn):

第一,數(shù)據(jù)表示不統(tǒng)一。當(dāng)前的 3D 結(jié)構(gòu)存在多種表示方式,尤其在不同尺度下差異顯著。宏觀結(jié)構(gòu)常用點(diǎn)云、網(wǎng)格(Mesh)等表示方式,而微觀結(jié)構(gòu)則多采用原子坐標(biāo)或圖結(jié)構(gòu)。這些表示方式的差異導(dǎo)致建模思路截然不同。即使在同一尺度,由于數(shù)據(jù)特性的差異,不同類型的結(jié)構(gòu)(如晶體、蛋白質(zhì)、分子)也往往采用各自專用的表示與模型,難以兼容。這種表示上的割裂嚴(yán)重限制了模型的通用性,也阻礙了構(gòu)建可借助大規(guī)模數(shù)據(jù)訓(xùn)練的通用基礎(chǔ)模型的可能性。

第二,建模任務(wù)不統(tǒng)一。 3D 結(jié)構(gòu)相關(guān)任務(wù)可分為生成和理解兩大類,但它們各自獨(dú)立發(fā)展。生成任務(wù)多依賴擴(kuò)散模型,從隨機(jī)噪聲逐步合成穩(wěn)定結(jié)構(gòu),而理解任務(wù)則主要基于無(wú)監(jiān)督預(yù)訓(xùn)練方法。相比之下,大型語(yǔ)言模型(LLM)已通過(guò)自回歸方式成功實(shí)現(xiàn)了生成與理解任務(wù)的統(tǒng)一,但這種統(tǒng)一范式在 3D 結(jié)構(gòu)建模領(lǐng)域仍然鮮有嘗試。若能借助自回歸方法統(tǒng)一 3D 任務(wù)建模,不僅有望打通理解與生成的界限,更可能將 3D 結(jié)構(gòu)納入多模態(tài)大語(yǔ)言模型的處理范式,繼圖像和視頻之后成為 LLM 可理解的新模態(tài),為構(gòu)建面向物理世界的通用多模態(tài)科學(xué)模型奠定基礎(chǔ)。

圖片

Uni-3DAR 整體架構(gòu)

下面我們具體解讀下這篇論文的兩個(gè)核心技術(shù)。

Compressed Spatial Tokens
統(tǒng)一微觀與宏觀 3D 結(jié)構(gòu)

3D 結(jié)構(gòu)在微觀(如原子、分子、蛋白質(zhì))和宏觀(如物體整體、力學(xué)結(jié)構(gòu))層面均表現(xiàn)出顯著稀疏性:大部分空間為空白,只有局部區(qū)域含有重要信息。傳統(tǒng)的全體素網(wǎng)格表示計(jì)算資源消耗巨大,無(wú)法利用這種稀疏性。

為此,Uni-3DAR 提出了一種層次化、由粗到細(xì)的 token 化方法,實(shí)現(xiàn)了數(shù)據(jù)的高效壓縮和統(tǒng)一表示,既適用于微觀也適用于宏觀 3D 結(jié)構(gòu)建模,為后續(xù)的自回歸生成與理解任務(wù)提供了堅(jiān)實(shí)基礎(chǔ)。

圖片

1. 層次化八叉樹壓縮

該方法首先利用八叉樹對(duì)整個(gè) 3D 空間進(jìn)行無(wú)損壓縮。具體做法是從包含整個(gè)結(jié)構(gòu)的一個(gè)大格子開始,針對(duì)非空格子(即包含原子或其他結(jié)構(gòu)信息的區(qū)域),遞歸地將其均分為 8 個(gè)等大小的子單元。經(jīng)過(guò)多層細(xì)分后,形成一個(gè)由粗到細(xì)的層次結(jié)構(gòu),其每一層的 token 不僅記錄了區(qū)域是否為空,還保留了該區(qū)域的空間位置信息(由所在層次及格子中心坐標(biāo)確定),為后續(xù)的自回歸生成提供了明確的空間先驗(yàn)。

2. 精細(xì)結(jié)構(gòu) token 化

雖然八叉樹可以有效壓縮空白區(qū)域,但它僅提供了粗粒度的空間劃分,無(wú)法捕捉到諸如原子類型、精確坐標(biāo)(在微觀結(jié)構(gòu)中)或物體表面細(xì)節(jié)(在宏觀結(jié)構(gòu)中)等重要信息。

為此,該團(tuán)隊(duì)在最后層非空區(qū)域內(nèi)進(jìn)一步引入了「3D patch」的概念 —— 類似于圖像領(lǐng)域中的 2D patch 的處理。通過(guò)將局部結(jié)構(gòu)細(xì)節(jié)進(jìn)行離散化(例如采用向量量化技術(shù)),將連續(xù)的空間信息轉(zhuǎn)化為離散的 token。

這樣一來(lái),無(wú)論是描述微觀尺度下單個(gè)原子的信息,還是刻畫宏觀尺度下物體表面的細(xì)節(jié),都能以同一形式進(jìn)行表示。

3. 二級(jí)子樹壓縮

由于即使在八叉樹結(jié)構(gòu)下,token 數(shù)量仍可能較多,該方法進(jìn)一步提出了二級(jí)子樹壓縮策略。具體來(lái)說(shuō),將一個(gè)父節(jié)點(diǎn)及其 8 個(gè)子節(jié)點(diǎn)的信息合并為一個(gè)單一的 token(利用父節(jié)點(diǎn)固定狀態(tài)以及子節(jié)點(diǎn)的二值特征,共可組合成 256 種狀態(tài)),從而將 token 總數(shù)約降低 8 倍。這不僅大幅提高了計(jì)算效率,也為大規(guī)模 3D 結(jié)構(gòu)的高效建模提供了可能。

綜上,該方法充分利用了 3D 結(jié)構(gòu)固有的稀疏性,通過(guò)八叉樹分解、精細(xì) token 化與二級(jí)子樹壓縮,不僅大幅降低了數(shù)據(jù)表示的復(fù)雜度,而且實(shí)現(xiàn)了從微觀到宏觀 3D 結(jié)構(gòu)的統(tǒng)一表示,為后續(xù)自回歸生成與理解任務(wù)提供了高效、通用的數(shù)據(jù)基礎(chǔ)。

Masked Next-Token Preiction
統(tǒng)一生成和理解的自回歸框架

在傳統(tǒng)自回歸模型中,token 的位置是固定的 —— 例如在文本生成中,第 i 個(gè) token 后總是緊接著第 i+1 個(gè) token,因此下一個(gè) token 的位置可以直接推斷,無(wú)需顯式建模。

然而,在該論文提出的粗到細(xì) 3D token 化方法中,token 是動(dòng)態(tài)展開的,其位置在不同樣本間存在較大變化;如果不顯式提供位置信息,自回歸預(yù)測(cè)的難度將大大增加。為此,該論文提出了 Masked Next-Token Prediction 策略。

圖片

具體而言,該方法對(duì)每個(gè) token 復(fù)制一份,確保兩個(gè)副本具有相同的位置信息,然后將其中一個(gè)副本替換為 [MASK] token。在自回歸預(yù)測(cè)過(guò)程中,由于被掩碼 token 與目標(biāo) token 的位置信息完全一致,模型能夠直接利用這一明確的位置信息來(lái)預(yù)測(cè)下一個(gè) token 的內(nèi)容,從而更精確地捕捉下一個(gè) token 的位置特征,提高預(yù)測(cè)效果。盡管復(fù)制 token 使序列長(zhǎng)度翻倍,但實(shí)驗(yàn)結(jié)果表明,該策略顯著提升了性能,而推理速度僅下降 15% 至 30%。

基于 Masked Next-Token Prediction,該論文構(gòu)建了一個(gè)統(tǒng)一的自回歸框架,使得 3D 結(jié)構(gòu)的生成與理解任務(wù)能夠在單一模型內(nèi)同時(shí)進(jìn)行。

具體來(lái)說(shuō),生成任務(wù)(包括單幀與多幀生成)在被掩碼的 token 上執(zhí)行,利用自回歸機(jī)制逐步構(gòu)建結(jié)構(gòu);token 級(jí)理解任務(wù)(如原子級(jí)屬性預(yù)測(cè))則依托精細(xì)結(jié)構(gòu) token 進(jìn)行;而結(jié)構(gòu)級(jí)理解任務(wù)則引入了一個(gè)特殊的 [EoS](End of Structure) token,用于捕捉整體結(jié)構(gòu)的全局信息。

此設(shè)計(jì)使不同任務(wù)對(duì)應(yīng)的 token 在模型內(nèi)部彼此獨(dú)立、互不干擾,從而支持聯(lián)合訓(xùn)練。同時(shí),自回歸特性也便于將其他模態(tài)數(shù)據(jù)(例如自然語(yǔ)言文本、蛋白質(zhì)序列、儀器信號(hào)等)統(tǒng)一到單個(gè)模型,進(jìn)一步提升模型的泛化能力和實(shí)用性。

實(shí)驗(yàn)結(jié)果

該論文在微觀 3D 結(jié)構(gòu)領(lǐng)域設(shè)計(jì)了一系列任務(wù),包括分子生成、晶體結(jié)構(gòu)生成與預(yù)測(cè)、蛋白結(jié)合位點(diǎn)預(yù)測(cè)、蛋白小分子對(duì)接以及基于預(yù)訓(xùn)練的分子性質(zhì)預(yù)測(cè)。

實(shí)驗(yàn)結(jié)果顯示,在生成任務(wù)中,Uni-3DAR 的性能大幅超過(guò)了擴(kuò)散模型方法;而在無(wú)監(jiān)督預(yù)訓(xùn)練的理解任務(wù)上,其表現(xiàn)與基于雙向注意力的模型基本持平。這些成果充分證明,Uni-3DAR 不僅能統(tǒng)一不同類型的 3D 結(jié)構(gòu)數(shù)據(jù)及任務(wù),而且在效果和速度上均實(shí)現(xiàn)了顯著提升。

圖片

3D 小分子生成任務(wù)性能

圖片

晶體結(jié)構(gòu)預(yù)測(cè),以及基于多模態(tài)信息(粉末 X 射線衍射譜)的晶體結(jié)構(gòu)解析性能

圖片

蛋白結(jié)合位點(diǎn)預(yù)測(cè)效果

圖片

蛋白小分子對(duì)接效果

圖片

基于預(yù)訓(xùn)練的小分子屬性預(yù)測(cè)效果,其中 Uni-Mol 和 SpaceFormer 也為深勢(shì)科技提出的專用模型,Uni-3DAR 超過(guò)了 Uni-Mol,與 SpaceFormer 基本持平

圖片

基于預(yù)訓(xùn)練的高分子聚合物性質(zhì)預(yù)測(cè),其中 Uni-Mol 和 MMPolymer 也為深勢(shì)科技提出的專用模型,Uni-3DAR 超過(guò)了 Uni-Mol,與 MMPolymer 基本持平

未來(lái)展望

目前,Uni-3DAR 的實(shí)驗(yàn)主要集中在微觀結(jié)構(gòu)領(lǐng)域,因此亟需在宏觀 3D 結(jié)構(gòu)任務(wù)中進(jìn)一步驗(yàn)證其通用性和擴(kuò)展性。

此外,為保證與以往工作的公平對(duì)比,當(dāng)前 Uni-3DAR 在每個(gè)任務(wù)上均采用獨(dú)立訓(xùn)練。未來(lái)的一個(gè)重要方向是融合多種數(shù)據(jù)類型與任務(wù),構(gòu)建并聯(lián)合訓(xùn)練一個(gè)更大規(guī)模的 Uni-3DAR 基座模型,以進(jìn)一步提升性能與泛化能力。

同時(shí),Uni-3DAR 還具備天然的多模態(tài)擴(kuò)展?jié)摿?。后續(xù)可以引入更多模態(tài)的信息,例如蛋白質(zhì)序列、氨基酸組成,甚至結(jié)合大語(yǔ)言模型與科學(xué)文獻(xiàn)知識(shí),共同訓(xùn)練一個(gè)具備物理世界理解能力的多模態(tài)科學(xué)語(yǔ)言模型,從而為構(gòu)建通用科學(xué)智能體打下基礎(chǔ)。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2023-12-07 13:07:59

3D模型訓(xùn)練

2025-05-27 15:28:11

模型訓(xùn)練AI

2025-02-13 08:26:26

2025-04-10 09:10:00

模型AI評(píng)測(cè)

2021-03-05 16:14:08

AI 數(shù)據(jù)人工智能

2025-06-24 08:40:00

3D模型訓(xùn)練

2011-04-26 14:21:20

3DJVC投影機(jī)

2021-03-18 15:29:10

人工智能機(jī)器學(xué)習(xí)技術(shù)

2025-04-25 09:15:00

模型數(shù)據(jù)AI

2022-09-14 09:23:51

Java3D引擎

2023-12-29 13:18:23

模型NeRFTICD

2024-04-26 12:51:48

2025-05-19 08:20:00

2019-12-23 10:22:05

AI 數(shù)據(jù)人工智能

2019-11-29 09:30:37

Three.js3D前端

2024-07-03 14:29:38

2025-03-27 09:26:30

2023-12-06 13:36:00

模型數(shù)據(jù)

2024-10-28 07:40:00

2024-12-10 09:40:00

AI3D模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 成年人免费在线视频 | 国产在线精品区 | 日韩高清在线 | 男女网站免费观看 | 日韩国产一区二区三区 | 狠狠狠色丁香婷婷综合久久五月 | 在线激情视频 | 国产精品视频一区二区三 | 神马久久久久久久久久 | 久久91精品国产一区二区 | 在线观看www | 亚洲欧美在线视频 | 爱操影视 | 亚洲国产精品网站 | 精品视频一区二区三区在线观看 | 久久久久久久久99精品 | 欧美在线一区二区三区 | 成人免费黄视频 | 久久精品国产一区 | 一区二区中文字幕 | 中日韩欧美一级片 | 日本在线看片 | 欧美在线a | 国产欧美一区二区三区国产幕精品 | 天堂亚洲网 | 国产乱码高清区二区三区在线 | 超黄毛片 | 日韩视频免费看 | 亚洲 欧美 在线 一区 | 成人不卡在线 | 日韩成年人视频在线 | 午夜影院免费体验区 | 精国产品一区二区三区 | 国产在线精品一区二区 | 国产精品欧美一区二区三区 | 亚洲国产一区在线 | 日韩at| 成人二区| 久久国产精品偷 | 午夜视频免费网站 | 久久精品视频亚洲 |