OpenAI版終結者降臨!地表最強機器人Figure 02問世,進寶馬狂飆20小時
號稱OpenAI二代機器人「Figure 02」,真的來了!
剛剛,Figure AI終于官宣了第二代人形機器人,完全換了一身新形象——黑色的外觀,更加靈活的五指。
創始人Brett Adcock表示,「這是『地表最強』的人形機器人」!
值得一提的是,Figure 02的設計評審耗時18個月完成。
據介紹,迭代后的Figure手部具有16個自由度,能夠承受與人類相當的力量。
現在的它,已經進入寶馬車廠開始打工了,可以無休止地狂干20個小時。
Figure 02還可以與人類直接開啟「語音對話」,這背后依舊用上了OpenAI最先進的定制AI模型,通過語音-語音進行推理。
與初代類似,它擁有一個機載的視覺模型(VLM),可通過攝像頭,完成視覺推理。
去年,初代機器人Figure 01,同樣在OpenAI大模型的加持下,能夠看、聽、遵循人類指令。
不僅如此,這家明星初創背后,還得到了英偉達、奧特曼、貝佐斯等大佬的聯合投資。
如今,工程和設計團隊在Figure 02上完成了一次從零開始的硬件和軟件重新設計。
其中,在包括人工智能、計算機視覺、電池、電子設備、傳感器和執行器等關鍵技術上,取得了巨大的進步:
- 語音到語音:通過內置麥克風和揚聲器連接自定義AI模型,能夠與人類進行對話
- 攝像頭:由6個內置RGB攝像頭驅動的AI視覺系統
- 手部:第四代手部具有16個自由度和等同于人類的力量
- 內置VLM:使機器人攝像頭能夠進行快速的常識性視覺推理
- 電池:機器人軀干內的2.25千瓦時定制電池組提供50%以上的能量
- CPU/GPU:相比上一代,機載計算和AI推理能力提高了3倍
更流線型的外觀
Figure 02機器人與其前身Figure 01身高相似,但在很多方面都進行了改進。
最明顯的變化是機器人的「皮膚」采用了啞光黑色外觀,而不是Figure 01的鉻金屬飾面。
之前的機器人看起來像穿著盔甲,而Figure 02看起來像一輛現代跑車,擁有流線型的曲線和精致的外觀。
另一個變化部分就是電纜。在Figure 01中,電纜被故意布置在機身外部,以支持測試夾具、更換傳感器和電機,并加快維修速度。
而在Figure 02中,所有電纜都集成到了四肢中,保護它們免受環境的影響,并為長時間在生產線上工作做好準備。
Figure AI表示,新機器人的電池容量比Figure 01大50%,能夠在實際部署中工作更長時間。電池已集成到人形機器人的軀干中,使其重心更接近中心線位置,使得機器人更加靈活。
Figure AI還為其定制了電機,與關節傳動系統集成在一起,以優化每個關節的功率和性能。
機器人設計的一大難題,就是可靠地通過旋轉關節布線。
我們可以看到,Figure 02的肩部、肘部、髖部和膝部四個主要關節組設計非常簡潔,完美解決了這個難題。
準備好接收語音指令
AI模型的訓練決定了機器人智能和能力的核心,因此Figure AI與OpenAI的合作可謂「如虎添翼」,能夠快速測試、驗證和迭代機器人的語音互動功能。
早在GPT-4o發布前,Figure AI的視頻就展示了機器人如何通過語音指令與人類互動,最新發布的Figure 02在OpenAI定制模型到加持下,也可以通過麥克風和揚聲器人類進行對話。
Figure AI表示,Figure 02的計算和AI推理能力提升了3倍,可以在現實世界中完全自主地執行任務。
新型號配備了六個RGB攝像頭,用于感知物理世界,此外還配備了一個車載視覺語言模型,能夠快速進行常識性的視覺推理。
視覺模型能夠處理所有車載圖像以進行感知、避障,最重要的是進行手眼協調,以便機器人能夠識別并拾取面前的物體。
另外,比起Figure 01,Figure 02擁有3倍機載計算能力和AI推理能力。這使得機器人能夠完全自主地執行實際的AI任務。
這里AI數據引擎會提供最新的AI模型,并直接直接在設備的GPU上運行。
操控人手能抓的物體
自成立以來,Figure AI已經在機器人手部的設計和功能上投入了大量資金。
由此得到的最新設計,不僅具有十六個自由度(DoF),而且能夠承載最多25公斤(55.1 磅)的物體。
與此同時,這雙「手」的外觀也與人類都非常相似——有四根手指和一個拇指。
具體來說,每根手指由一個集成單元驅動,該單元包括傳感器和電機。
手腕是另一個新穎的設計,提供了與人類手腕相似的運動范圍,同時將所有電力和傳感信號線路封裝并引導到手和手指。
Figure AI表示,他們的目標就是讓機器人能夠操控任何人類手能抓住的物體。
資金雄厚,但人形機器人賽道競爭激烈
Figure AI最初擺脫「隱身」模式還是在2023年3月,推出了通用人形機器人Figure 01,希望能應用于工業制造、物流、倉儲、零售等多個行業以解決全球范圍內的勞動短缺問題。
根據創始人Adcock的設想,機器人們可以替人類承擔不安全和不受歡迎的工作,構建一個更加自動化且高效的未來。并且他堅稱,Figure AI的這項技術絕不會被武器化。
很難想象,Figure AI第一代全規模機器人的構建僅花了短短6個月的時間,不得不說,這得益于包括CTO Jerry Pratt在內的40名行業專家組成的強大團隊。
作為2024年初的投資寵兒,Figure AI目前已籌集了6.75億美元資金。
憑借雄厚的資金,聯合創始人兼CEO Brett Adcock正在全速推進,目標是在未來2~5年內將自主雙足機器人推向市場。
其實,今年早些時候,Figure AI就已經在南卡羅來納州一家寶馬工廠測試了。在這里,AI模型訓練的數據會被收集起來。
在演示中我們可以看到,機器人完全展現出了在工業環境中運行的能力,還能學習執行基本任務。
當然,這個越來越卷的賽道中,其他競爭對手也沒閑著。
Agility Robotics的Digit和Apptronik的Apollo,早就把自家機器人部署到了GXO物流公司中,執行簡單任務。
馬斯克家的Optimus,也很早就被「下放」到了特斯拉工廠;波士頓動力,也有意在現代設施中,給最新版Atlas進行測試。
在科幻故事中,我們早就見識過各類人形機器人,但在商業產品的推出上,它們其實一直進展緩慢。
一方面是受限于研究環境,另一方面,設計也非常昂貴。
然而,LLM和多模態AI模型的發展,改變了這一切!如果模型能快速分析實時視頻和音頻輸入,還能以類人音頻和動作進行相應,那科幻中的場景,顯然不會很遙遠了。
擁有Optimus的馬斯克最近大膽預言,地球上有超過100億臺人形機器人的市場,這意味著未來每個人會擁有不止一臺機器人。
此外,英偉達的GR00T項目也在進行時,展示了AI在指導人形機器人方面的進展。
Jim Fan發布的這個視頻中,人類遠程操作員可以通過佩戴Apple Vision Pro來引導機器人完成正確動作。
快速QA
由于官方并沒有透露太多信息,因此外媒IEEE Spectrum找到了Figure的控制總監Michael Rose和硬件總監Vadim Chernyak,并做了一波快速的QA。
問:Figure 02有多少個部件?這些是全部嗎?
答:有幾百個獨特的部件,總共有幾千個部件。不,這不是全部。
問:Figure 02每走一步都會留下Figure標志嗎?
答:如果表面足夠柔軟的話,是的。
問:「可更換的腿」是很難做到的嗎,還是因為只需要做一條腿而更容易呢?
答:我們選擇制作可更換的腿是為了便于制造。
問:電池包也是可更換的嗎?
答:我們的電池是可更換的,但這不是一個快速更換的過程。
問:Figure 02膝蓋后面和肘關節處那個看起來軟軟的東西是什么呢?
答:這些是軟限位器,它們以受控的方式限制運動范圍,并防止機器人夾傷。
問:你們把拇指的馬達藏哪了?
答:拇指現在完全包含在手中。
問:脖子上的「皮膚」是什么?
答:這種皮膚是一種柔軟的織物,即使機器人移動頭部,也能保持干凈無縫的外觀。
問:當Figure 02的頭部轉動時,它的身體也會轉動,手臂也會移動。這是必要的,還是只是出于美學考慮?
答:只是出于美學考慮。
問:上半身和肩膀看起來比其他人形機器人窄得多。為什么設計成這樣?
答:我們認為將機器人設計成與人類相似的比例非常重要。這使我們能夠完成目標使用場景,并更容易適應環境。
問:Figure 02的步態是如何設計的?
答:機器人使用模型預測控制器來確定腳步位置和維持平衡所需的力量,從而跟隨預定的軌跡。
問:2.25千瓦時的電量在視頻中的那些任務中能運行多長時間?
答:我們的目標是讓產品運行5小時。
本文轉自 新智元 ,作者:新智元
