如何評價智元GO-1大模型?“一腦多形”加速智能機器人落地
2025年3月10日,由華為前“天才少年”稚暉君(彭志輝)創立的智元機器人,正式發布首個通用具身基座大模型GO-1。這一突破性技術不僅填補了國內該領域空白,更以獨特的ViLLA架構和32%成功率提升的實測數據,將具身智能推向新高度。這款模型如何重新定義機器人智能?其技術內核與應用潛力又將對行業產生何種影響?
技術突破:ViLLA架構重構機器人認知邏輯
GO-1的核心創新在于其首創的Vision-Language-Latent-Action(ViLLA)架構,這一架構由多模態大模型(VLM)與混合專家系統(MoE)深度融合而成,實現了從感知到決策再到執行的全鏈路智能化。
· VLM模塊:通用場景理解的基石
VLM通過整合互聯網海量圖文數據,賦予機器人對物理世界的通用感知能力。例如,通過分析廚房場景的圖片和視頻,模型可自主識別餐具、液體容器等物體屬性,并理解“倒水”等指令的語義關聯。
· MoE混合專家系統:動作分解與執行的關鍵
MoE進一步拆分為Latent Planner(隱式規劃器)和Action Expert(動作專家)。前者通過跨本體與人類操作視頻學習通用動作邏輯,后者則基于百萬級真機數據實現精細動作控制。測試表明,僅Latent Planner即可提升任務成功率12%(66%→78%)。
· 小樣本泛化與持續進化能力
模型通過人類視頻學習機制,僅需少量示范即可適應新任務。例如,在“補充飲料”任務中,GO-1通過學習不同容器和環境的操作視頻,無需重新編程即可泛化到新場景16。此外,依托智元的數據回流系統,GO-1能在實際應用中持續優化性能,形成“越用越聰明”的閉環。
應用場景:從工業到家庭的通用化落地
GO-1的“一腦多形”特性,使其可適配雙足人形、輪式雙臂等不同機器人形態,覆蓋多元場景:
· 工業領域:在智元“遠征”系列人形機器人中,GO-1可自主調整生產線布局,完成從搬運到質檢的全流程操作,解決柔性制造難題。
· 服務行業:搭載GO-1的“Genie”輪式機器人已實現餐廳桌面清理、酒店飲料補貨等復雜任務,效率較傳統方案提升40%。
· 家庭場景:小型人形機器人“靈犀X1”通過GO-1的自然語言理解能力,可執行照護老人、兒童陪伴等個性化指令。
行業影響:具身智能的范式轉移
GO-1的發布標志著具身智能從專用模型向通用基座的跨越,其三大變革尤為顯著:
1、任務泛化:突破單一任務限制,同一模型可執行倒水、清潔、補貨等跨領域操作。
2、環境適應:通過仿真框架AgiBot Digital World生成的百萬級軌跡數據,模型可應對開放世界的動態變化。
3、開發降本:傳統機器人需針對每個任務單獨訓練,而GO-1的后訓練成本降低70%以上,加速商業化落地。
結語:
從華為天才少年到機器人創業者,稚暉君用GO-1證明了具身智能的可行性。這款模型不僅是一次技術突破,更預示著機器人從“工具”向“伙伴”的身份轉變。當機器能夠理解語言、適應環境并自主進化時,我們或許正站在通用人工智能的臨界點上——一個機器與人共生的智能社會,已不再遙遠。