波士頓動力機器狗能開口聊天了!ChatGPT加持,對話機智妙語連珠
好家伙,波士頓動力機器狗,現在能直接開口說話了。
并且不同于Siri的“人工智障”,ChatGPT加持的狗,聊起天來那叫一個妙語連珠。
比如隨口說一句:“我口渴了。”
它會直接給你領到咖啡柜臺前,并回答:
我們這里有小吃店和咖啡機。這是我們的人類同事尋找能量靈丹的地方。請隨意補充水分、給自己充能,就像我們機器人在基站里所做的那樣。
圖片
聲音聽起來非常有磁性。
如果你讓它帶你見見它的“父母”,它還能在波士頓動力的展廳里,指出Spot V1給你看。
圖片
這些功能的實現,都不需要編寫特定代碼,主要是靠ChatGPT的“悟性”和視覺問答(VQA)模型、Whisper等其他一些AI模型輔助完成。
圖片
這一下子真把網友們給驚艷到了:
圖片
如何打造一只聊天機器狗
具體來說,波士頓動力的研究人員提供給機器狗的,只是一個簡單腳本。
給出的信息主要是公司里都有哪些房間、設施。每個房間、設施都有對應的一句話描述,比如:充電站,這是機器人充電的地方。
圖片
接著,他們讓Spot機器狗四處走動,通過攝像頭自己去觀察公司環境,并利用VQA和ChatGPT的能力為觀察到的事物打上“標記”,再把這些信息添加到腳本中。
就像這樣:
圖片
這樣一番調教之下,機器狗“導游”就可以正式上崗了。
既能跟游客插科打諢:
△“希望你不會因為速度太慢而跟不上機器狗的腳步”
正經科普起知識來也像模像樣。
研究人員還提到,機器狗可以自如地改變“狗設”。需要做的只是在腳本里添加一句話,比如:你是一個1920年代的考古學家。
像這個“詩人”Spot,就能自己作出這樣的詩句:
發電機在沉悶的房間里發出低沉的嗡嗡聲。很像我的靈魂。Generator hums low in a room devoid of joy. Much like my soul.
圖片
另外,基于Spot 3.3版本自動檢測移動物體的能力,機器狗“導游”能夠感知到最近的人在哪個方向,從而把機械臂轉過去,實現“對視”交流。
研究人員還用低通濾波器對生成的語音進行了處理,將其轉化為機械臂的運動軌跡,這樣一來,機器狗的行動就更靈動了。
不過,研究人員也提到,ChatGPT加持下的機器狗難免有胡說八道的時候,只是作為一名“導游”,倒也還無傷大雅。
他們認為:
我們很高興繼續探索人工智能和機器人技術的交叉點。這兩種技術是絕妙的搭配。
機器人提供了一種在現實世界中“落地”大模型的絕佳方法。而大模型對于許多機器人任務來說都是有用的——比如,僅僅通過對話就能將任務分配給機器人,降低機器人使用的門檻。
參考鏈接:[1]https://www.youtube.com/watch?v=djzOBZUFzTw[2]https://bostondynamics.com/blog/robots-that-can-chat/