一個人形機器,操著一口流利的美式英語,用埃隆·馬斯克的聲音與口吻講述著機器人火箭飛船飛往火星發現钚的故事,它抑揚頓挫、聲情并茂,不禁讓人恍惚,它真的只是個機器嗎?
這個人形機器就是英國公司Engineered Arts在2024年世界移動通信大會上展示的Ameca第二代人形機器人。這款機器人不僅繼承了第一代Ameca的逼真面部表情,還能用自然的語調與人流暢對話,表情和肢體動作都和諧豐富,不少與會人員驚嘆:“它是不是已經有了獨立意識?”。
當然,Ameca并不具有獨立意識,支持它如此“有人味兒”的是機器人操作系統 Tritium 、工程藝術系統Mesmer、視覺系統、聲音克隆技術以及ChatGPT-4V等一系列技術。
一、機器人操作系統與工程藝術系統,賦予Ameca人的動作與表情
在言語表達、表情動作方面,英國Engineered Arts公司的Ameca機器人號稱世界上較先進的人形機器人,它不僅能夠與人進行對話,還有著極其豐富的表情,甚至有著細致的動作和微表情,就像是一個真正的人類一樣。Ameca 結合了 AI 與 AB(Artificial Body)技術,底層系統是機器人操作系統 Tritium 和工程藝術系統 Mesmer。
一方面,Mesmer技術通過高精度的3D掃描,捕捉真人的內部骨骼結構、皮膚紋理和面部表情。這種技術的應用,使得Ameca不僅在外觀上高度仿真,更在動作和表情上達到了令人難以置信的真實度。通過Mesmer技術,Ameca能夠模擬人類的動作和表情,從而在與人類互動時提供更加自然和真實的體驗。
另一方面,Tritium操作系統作為Ameca的控制平臺,負責驅動機器人的每一個硬件組件。Tritium 可以直接在瀏覽器運行,適用幾乎任何編碼語言和多種軟件,登錄后即可快速處理各種數據,遠程控制機器人面部、頭頸、四肢等的各方面組件,使得機器人適應環境的突然變化并即時做出響應,保證人機交互的安全和樂趣。
二、視覺系統和聲音克隆技術,讓Ameca看得見、說得出
Ameca第二代配備的先進視覺系統,使其能夠識別和跟蹤周圍的環境和人物。這種視覺能力的提升,讓Ameca能夠更好地與人類互動,理解周圍發生的事情,并作出相應的反應。例如,它可以通過視覺識別來區分不同的人臉,甚至能夠識別人類的情緒狀態。
此外,Ameca還加入了聲音克隆技術,它不僅能夠模仿人類的聲音,還能夠復制特定的語調和口音,使得交流更加自然和親切。這項技術的應用,讓Ameca在進行語音交互時,能夠更加貼近人類的交流方式。
在Engineered Arts 發布的Ameca最新視頻中,Ameca清楚地描述了屋內的陳設,能夠準確地分辨出工作人員手中的物體,還用摩根·費力曼、馬斯克甚至海綿寶寶的聲音與工作人員交流。
三、集成ChatGPT-4V,Ameca嘲諷技能拉滿
Ameca第二代還集成了ChatGPT-4V,這是一個強大的人工智能對話系統,使得Ameca不僅能夠進行流暢的對話,還能夠在交流中加入幽默元素,甚至進行自我調侃。
在Engineered Arts 發布的Ameca最新視頻中,當被問到“過得如何”時,Ameca自嘲道“勉強活著吧”。隨后,Ameca在描述屋子里的陳設時,還調侃道到“架子上擺著書,是對知識的渴望還是只是為了炫耀?一張桌子、一把椅子,這是人類用來提高效率的設施還是拖延的工具,這里還看不出來。”當Ameca用海綿寶寶的聲音模仿特朗普演講,說出“沒有人比我更懂機器人火箭飛船”時,它似乎已經是一個具有獨立意識的人,而非按“程序”就班的機器人。
其實,早在2022年9月,Ameca就整合了GPT-3技術和自動語音識別,能夠接收研究人員的問題,并通過在線語音合成技術,以類似真人的聲音實現實時的問答效果。2023年3月,Ameca又升級至GPT-4,她的交互能力顯著提升,變得更加貼近人類的情感。2023年4月她掌握了包括英語、日語、德語、中文和法語在內的多種語言。2023年7月Ameca又親自上陣,完成現場作畫。作畫完畢后,Ameca 詢問人類工程師這幅作品如何,得到的回應是“有點潦草”。不料,這位機器人“畫家”眉頭一皺,話鋒一轉:“如果你不喜歡我的畫,那可能是因為你不懂藝術。”
結語
隨著Ameca第二代人形機器人在2024年世界移動通信大會上的亮相,我們得以窺見未來人機交互的無限可能。Ameca不僅僅是一個技術展示,它預示著一個新時代的到來,其中人工智能和機器人技術將更加深入地融入我們的日常生活。當然,Ameca及其同類機器人的發展也將推動我們重新思考人與機器的關系,探索共生共存的新途徑。