一年秀一次!稚暉君的人形機器人上新了,還有開源、免費彩蛋
一年一秀,稚暉君的第二代人形機器人來了。
靈巧小手,正在麻將桌上叱咤風云:
不對不對,讓我們先看看整體氣質:
然后是常規家務,能看出來也是非常熟練:
在大模型風靡的 2024 年,如果說 AI 領域什么最火,「具身智能」這個方向必定位列其中。
視線放到國內,「智元機器人」這家具身智能公司備受矚目。自 2023 年 2 月成立以來,「智元機器人」已馬不停蹄地完成了 6 輪融資,迅速成為機器人創業圈的「頂流項目」。
創業半年,稚暉君和團隊就拿出了首款產品「遠征 A1」。一出道,「遠征 A1」的行走能力和人機互動就是業界領先水平。不過,在「遠征 A1」初次亮相之后,我們似乎再也沒聽說過它的下一步消息,甚至沒有放出任何整活視頻。
但今天的發布會之后,我們知道了,智元機器人在「悶聲干大事」。
在這場發布會中,稚暉君一口氣推出了三款遠征系列機器人產品:交互服務機器人「遠征 A2」、柔性智造機器人「遠征 A2-W」、重載特種機器人「遠征 A2-Max」。最后的 One more thing 環節,智元 X-Lab 孵化的模塊化機器人系列產品「靈犀 X1」和「靈犀 X1-W」也作為「彩蛋」正式亮相。
相比上一代,五款機器人采用了家族化設計語言,對機器人的外形進行了系列化的規整,結合輪式與足式兩種形態,覆蓋交互服務、柔性智造、特種作業、科研教育和數據采集等應用場景。
關于量產進度,智元機器人也透露了最新消息:2024 年預估發貨量將達到 300 臺左右,其中雙足 200 臺左右,輪式 100 臺左右。
新一代遠征 A2
從「遠征 A1」開始,智元在機器人產品上的落地方向就已經很清晰:「進廠打工」。今年的「遠征 A2」更是為批量「進廠打工」做了更充分的準備。
我們來看下這個家族的成員:
「遠征 A2」是一款交互服務機器人,全身具備超過 40 個主動自由度的關節和仿人的靈巧雙手,能夠模擬出豐富和復雜的人類工作。它擁有一個可以持續學習的大腦,由大語言模型加持。此外,它還具備多模態的感知,輸入系統,可以通過視覺感知交互者的情緒。
「遠征 A2-Max」是一款重載特種機器人,既力大無窮又具備靈巧作業的優勢,在開場的情景劇中,它輕松地搬動了 40kg 的航空箱,目前「遠征 A2-Max」還處于產品研發階段。
「遠征 A2-W」是一款柔性智造機器人,它的兩條手臂既可以獨立操作,也可以協同工作。它采用了輪式底盤,結合機身搭載的 rgbd 激光雷達、全景相機、為全域安全配置的傳感器等等構件,使得它可以在各種環境中快速而平穩的移動。
在發布會前,「遠征 A2-W」的表現簡直像鋼鐵俠的「賈維斯」走進了現實。在聽懂稚暉君的指令后,它完全自主地打開了可樂瓶子,在榨汁機中放入葡萄,按下榨汁機,一滴沒撒地把榨汁機里的飲料倒進了杯子,給稚暉君端上了一杯「萄氣可樂」。
除了顏值提升,「遠征 A2」系列機器人更是內外兼修。對于機器人的核心零部件,「智元機器人」創新地將機器人系統劃分為動力域、感知域、通信域、控制域。顯然,「智元機器人」都是沖著全棧生態去的。
在動力域方面,「智元機器人」對 PowerFlow 關節模組實現了量產化迭代升級,從參數上看,PowerFlow 關節模組都有大幅提升。在穩定性和可靠性方面,「智元機器人」也對其峰值性能、老化速度等方面進行了大量測試和優化。
對于「干活」而言對重要的靈巧手,這回「智元機器人」也升級了一番:自由度數躍升至 19 個,主動自由度翻倍至 12 個,在感知能力方面也引入了更多模態,例如基于 MEMS 原理的觸覺感知和視觸覺感知技術。
此外,「智元機器人」還推出了高精度力控 7 自由度雙臂,能夠精準執行阻抗控制、導納控制、力位混控等多種力控任務,也支持雙臂拖拽示教模式和可視化調節。
對于感知域方面,新一代的遠征機器人系列集成了 RGBD 相機、激光雷達、全景相機等傳感器,引入自動駕駛 Occupancy 前沿感知方案,通過 SLAM 算法進一步提升環境理解能力。
在通信域方面,「智元機器人」自研了具身原生、輕量化、高性能的智能機器人通信框架 AimRT。相比 ROS 等第三方中間件,提升了性能、穩定性、系統部署的效率和靈活性,同時又完全兼容 ROS/ROS2 已有生態。AimRT 將于 9 月底開源。
對于控制域方面,「智元機器人」結合了 Model-based 與 Learning-based 兩種算法,進一步提升機器人運動控制與適應能力。對于 Model-based,「智元機器人」進一步提升了系統的魯棒性,因此,在發布會上機器人所做的演示才能如此流暢和絲滑。對于 Learning-based 算法,「智元機器人」在這里劃了一個重點,希望能促成機器人訓練方法從算法驅動 - 數據驅動的轉變。
在運控算法的基礎上,「智元機器人」預研了基于自然語言指令集驅動的、可以適配不同機器人本體的 AgentOS,基于強化學習,實現機器人技能的精準編排與高效執行。
首次提出 G1-G5 具身智能技術演進路線
在本次發布會上,智元機器人還首次提出了具身智能領域的技術演進路線,包含從 G1 到 G5 五個階段:
G1 指的是基礎自動化階段,也就是基于手工設計的特征,配合簡單的機器視覺去做一些反饋。這一階段的部署是為特定的場景量身定制的,雖然可以解決某些場景下的任務執行問題,但無法在不同的場景里面做低成本快速遷移。
G2 是「通用原子技能」階段,針對大量不同的場景任務和各種作業的任務需求,提煉出一些可以復用的原子能力。簡而言之,是以相對通用的方式去實現類似場景任務的快速遷移,然后配合大語言模型框架去做任務編排,使得機器人具備一定的泛化能力。
G3 則意味著具身智能的整體架構開始調整為「端到端」的路線,盡管這個階段與 G2 階段的算法架構可能是類似的,但此時的各項「原子能力」的形成方式,已經由手工設計的算法驅動變為了大量數據采集之后的數據驅動。
區別于前三個階段,G4 階段將會出現一個通用的端到端操作大模型。到了這一階段,即可引入大量跨場景的真實數據和仿真數據,同時引入世界模型幫助 AI 理解現實世界背后的物理原理,理解不同任務背后底層邏輯的相通之處。比如對于「擰開瓶子」和「擰開門把手」這兩件事,就不再需要采集兩份單獨的數據以獲得兩項單獨的技能。最終通向無限趨近 AGI 的 G5 階段。
過去一年,智元機器人已經在 G2 路線取得了階段性突破,實現了通用的位姿估計模型 UniPose、通用的抓取模型 UniGrasp,通用的力控插拔模型 UniPlug 等一系列 zero-shot 和 few-shot 的通用原子技能。在 G2 階段的原子能力模型,面向柔性智造和交互服務場景,已經在多個實際場景中得到了商業應用。
在 G3 路線上,智元機器人也形成了一套完整的全流程具身數據方案 AIDEA(Agibot Integrated Data-system for Embodied AI,智元具身智能數據系統)。
但我們都知道,要想形成這樣一套方案,首先需要投入大量的數據采集成本,不是每個機器人團隊都有條件做到的。
而智元機器人做到了,還預備在今年第四季度開源。
稚暉君表示,數據采集是整個環節的痛點。在過去一年中他們面向數據做了大量的基建工作,而且形成了一套完整、全流程的數據采集、應用的方案 AIDEA。
AIDEA 除了提供硬件本體方案之外,也會提供整個云全鏈路數據平臺,還有 AIDEA ML 機器學習平臺進行模型訓練與算法評測,以及 AIDEA Sim 仿真平臺。
稚暉君表示,他預計接下來智元會有百臺以上自由部署機器人專門用來做端到端的數據采集,他們也將于四季度開源基于 AIDEA 的百萬條真機、千萬條仿真數據集,以積極建設開放生態。
稚暉君的 One more thing
大概因為覺得一年才開一次發布會屬實「鴿」太久了,稚暉君也在發布會最后公布了 One more thing:全棧開源機器人靈犀 X1、專業數采機器人靈犀 X1-W 兩款新品。
這兩款機器人來自于 X-Lab(稚暉君實驗室),是 10 個人不到 3 個月的時間做出的產品,里面有非常多的創新細節。例如,自研了 PF86 和 PF52 兩款全新的 PowerFlow 關節,融入了模塊化設計理念,可以通過簡單抱箍形式輕松拆裝。
基于 X-Lab 對極致創新的追求,稚暉君表示,會開源靈犀 X1 的本體設計圖紙、軟件框架、中間件源碼、基礎運控算法。
此外在執行器方面,X-Lab 自研了帶前饋力控、超低成本的自適應通用夾爪,也推出了滿足場景需求的百元級成本的六維力傳感器。
對了,靈犀的售價是零元,開源大部分設計資料及代碼,但賣零件。
稚暉君表示,希望這能夠推動「人形機器人人人造」時代的到來。
你喜歡嗎?