成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

文本、圖像、點云任意模態輸入,AI能夠一鍵生成高質量CAD模型了

人工智能 新聞
該項目由憶生科技聯合香港大學、上海科技大學共同完成,是全球首個同時支持文本描述、圖像、點云等多模態輸入的計算機輔助設計(CAD)生成大模型。

本文第一作者為上海科技大學信息學院碩士生徐京偉和憶生科技的王晨宇,指導老師為香港大學的馬毅教授和高盛華教授。王晨宇畢業于上海科技大學并獲得工學碩士學位。其所在的憶生科技由馬毅教授于 23 年底創立,致力于打造完整、自主、自洽的機器智能系統。

該項目由憶生科技聯合香港大學、上海科技大學共同完成,是全球首個同時支持文本描述、圖像、點云等多模態輸入的計算機輔助設計(CAD)生成大模型。

計算機輔助設計(Computer-Aided Design,簡稱 CAD)軟件是工業軟件的重要分支,也是工業設計流程中的核心工具。然而,目前的 CAD 軟件普遍缺乏簡易的交互工具,這在一定程度上限制了未曾接觸過 CAD 的用戶嘗試和探索的可能性。對于 CAD 建模從業者而言,多模態大模型技術的快速發展尚未充分轉化為 CAD 領域實際應用的便利性和效率提升。如果能夠通過多模態交互工具有效優化建模流程,提升效率、節約時間與精力,不僅可以進一步釋放專業用戶的創造潛能,還將為相關產業的發展注入新的活力。

為應對這一挑戰,項目團隊構建了首個覆蓋文本、圖像和點云輸入的多模態 CAD 數據集 Omni-CAD。該數據集致力于賦能多模態大語言模型,使其能夠基于條件輸入生成高質量的 CAD 模型。與此同時,針對 CAD 模型的拓撲質量、空間封閉性等核心屬性,團隊還設計了一系列創新的評估指標,為模型性能提供更全面的衡量標準。借助這一技術,用戶只需輸入簡單的文本指令,或上傳目標形狀的圖像,即可快速生成符合要求的 CAD 模型。這一突破不僅降低了非專業用戶的使用門檻,激發了更多人參與 CAD 設計的興趣,還為 CAD 建模從業者提供了高效可靠的工具支持。

圖片

  • 論文標題:CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM
  • 論文地址:https://arxiv.org/pdf/2411.04954
  • 項目主頁:https://cad-mllm.github.io/

研究背景計算機輔助設計(CAD)技術通過數字化工具,幫助設計師創建、修改和優化復雜對象,廣泛應用于工業設計與制造。但傳統的流程較為復雜,對專業知識有較高要求,導致非專業用戶難以參與設計。如何降低使用門檻,讓非專業人士通過簡單指令完成設計構想,已成為該領域亟待解決的挑戰之一。盡管之前一些工作已經在探索 CAD 的生成任務,但這些方法抑或難以滿足用戶對交互設計的需求,抑或只能針對特定的輸入進行生成,因此我們希望提供一個統一的框架能夠處理不同或多種輸入條件的 CAD 生成任務。

而另一方面,盡管多模態大模型(MLLMs)展現了跨模態生成的潛力,但在 CAD 領域依然面臨挑戰。尤其是在如何高效表征各種模態和 CAD 模型上,同時,數據集匱乏問題也一直是一大瓶頸。因此,我們提出了 CAD-MLLM,首個支持文本、圖像和點云三種模態及其組合模態輸入的以命令序列來表征的參數化 CAD 大模型,并搭配構建了一個超過 45 萬條數據的多模態 CAD 數據集 Omni-CAD,推進該領域的研究。

技術創新

1. 首個支持多模態輸入的參數化 CAD 生成多模態大模型

我們提出了一個能夠同時處理文本、圖像和點云,最多三種模態輸入數據的模型。圖像和點云輸入首先通過一個凍結的編碼器提取特征,經投影層對齊到大語言模型(LLM)的特征空間。隨后,將各種模態的特征進行整合,并利用低秩適應(LoRA)對 LLM 進行微調,實現基于多模態輸入數據的精確 CAD 模型生成。

圖片

2. 首個多模態 CAD 數據集

為了支持模型訓練,我們設計了一套全面的數據構造和標注管道,構建了包含 45 萬條的多模態 CAD 模型數據集 Omni-CAD。每條數據包含對應的 CAD 模型構造命令序列,以及文本描述、8 個不同視角的圖像(下圖隨機挑其中 4 個視角展示)以及點云數據,極大地填補了 CAD 多模態數據資源的空白,也有助于推動 CAD 生成領域的進一步發展。

圖片

圖片

3. 評估指標

在評估指標上,之前的工作更多聚焦在模型的重建質量和結構保真度上,而我們針對 CAD 模型的特性,基于最終生成的 CAD 模型的拓撲質量和空間封閉性,創新性地提出了四種量化指標。其中,Segment Error(SegE)檢測 CAD 模型節點連接分段的準確性,Dangling Edge Length (DangEL) 評估懸邊的比例來衡量生成模型流形的保真度,Self-Intersection Ratio (SIR) 檢測生成模型中的自相交面問題。而 Flux Enclosure Error (FluxEE) 則通過高斯散度原理,計算常矢量場穿過生成表面的通量,評估模型的空間封閉性。

性能評估

1. 基于點云的 CAD 模型生成性能

我們與多個點云重建或者基于點云生成的基準工作進行比較,評測結果展示出我們的方法在重建精度上表現出色。而在拓撲完整性的評估上,我們模型生成的 CAD 模型大多數生成結果都能保持嚴格的流形結構,沒有出現懸邊,具有較高的拓撲完整性。相比之下,基準模型在重建結果中往往存在許多懸空邊緣(如圖中藍線所示)。

圖片

圖片

圖片

2. 魯棒性測評

在基于點云生成 CAD 模型的比較實驗中,我們針對兩種受干擾的輸入數據的情況進行了測評:添加噪聲的點云數據及部分點缺失的點云數據。在從測試集中隨機挑選的 1000 個樣本上,使用 Chamfer Distance 來衡量生成結果,在兩種情況下,CAD-MLLM 的性能均優于基線工作,特別是在一些極端條件下,依然展現出了良好的性能。

圖片

圖片

3. 多模態數據訓練必要性測評

我們通過三個實際場景來展示多模態數據訓練對于模型生成能力的輔助提升,1)裁剪的點云數據;2)帶有噪聲的點云數據;3)雙視角圖像輸入。以上三種情況,單一模態數據的訓練,會由于細節丟失或者視角限制使得輸入信息的不準確,進而導致生成結果的不完整或者不精準,而加入完整的模型的文本描述,可有效彌補未觀測到的部分,生成更為完整、精確的 CAD 模型。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-11 09:53:27

人工智能AI 圖像

2023-11-30 13:04:56

LCM圖像

2023-09-25 12:02:34

AI模型

2023-11-20 12:49:01

2023-07-04 08:35:52

MetaGPT開源

2023-05-09 09:35:22

2023-08-28 13:06:47

2019-02-20 17:43:18

2025-01-17 11:05:00

模型訓練

2023-05-12 16:10:13

數字經濟

2011-05-31 13:43:46

外鏈

2017-07-14 09:54:47

代碼函數程序

2022-08-01 16:36:50

算力

2023-10-04 09:56:33

圖片AI

2024-07-04 10:13:18

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲有码转帖 | 亚洲黄色一区二区三区 | 二区三区在线观看 | 亚洲在线| av超碰| 欧美午夜影院 | 一级一级毛片免费看 | av免费在线观看网站 | 国产精品污www一区二区三区 | 日韩视频一区在线观看 | 狠狠热视频 | 欧美精品欧美精品系列 | 久久国产精品一区二区三区 | 国产亚洲精品成人av久久ww | www久久爱| 久久午夜剧场 | 国产伦精品一区二区三区照片91 | 日韩精品一区二区三区中文字幕 | www.操.com| 国产色在线 | 日韩精品一区二区三区免费视频 | 国产亚洲精品美女久久久久久久久久 | 日批免费在线观看 | 久久精品二区 | 国产中文一区二区三区 | 波多野结衣先锋影音 | 黄色精品 | aaa大片免费观看 | 欧美一级二级视频 | 天天综合国产 | 操操日| 久久精品国产亚洲a | 国产福利在线 | 国产高清在线精品一区二区三区 | 中文字幕在线观看 | 日本网站免费在线观看 | 国产精品久久av | 久日精品 | 日本国产一区二区 | 91国在线视频 | 欧美日韩三级视频 |