利用 ChatGPT 等大模型訓練,波士頓動力將 Spot 機器狗變成“會說話的導游”
▲ 圖源波士頓動力公司 YouTube 視頻截圖
10 月 27 日消息,波士頓動力公司于數小時前在其官方 YouTube 頻道上傳了一段視頻,展示了波士頓動力機器狗的“語言能力”。視頻中,波士頓動力機器狗化身“導游”帶領工作人員參觀自家公司的各種設施。
這只機器狗目前能夠回答問題,在發出聲音的同時,“嘴巴”也可以隨之張開。據介紹,波士頓機器狗目前之所以可以開口說話,是因為工程師們使用了 ChatGPT 的 API 和一些開源的大語言模型來對其進行訓練。同時,工程師們為機器狗配備了揚聲器,并添加文字轉語音功能。視頻中的機器狗使用一口“英國口音”詢問員工是否可以開啟旅程,并介紹即將參觀的充電站。
據波士頓動力公司的首席軟件工程師 Matt Klingensmith 介紹,為了實現上述的“導游”功能,團隊為機器狗提供了一個非常簡短的腳本,涉及公司設施中每個房間的信息。然后,機器狗將腳本與它身體上的攝像頭等硬件獲得的圖像結合起來,讓它在產生反應之前,能夠獲得更多關于它所見事物的資料。
波士頓機器狗這次能夠實現的能力不只是“導游”,它還可以吟出“發電機在沒有歡樂的房間里低聲哼唱,好像我的靈魂”這樣的詩句。當工作人員有一次問及機器狗的“父母”是誰時,它指向了辦公室中陳列的舊款機器狗。
綜合IT之家此前報道,波士頓動力公司的機器狗已經陸續展現了包括翻跳舞蹈、智能重新規劃路線、跑酷、倒啤酒等在內的多種技能。2020 年 12 月,現代汽車宣布以 10 億美元收購波士頓動力,成為波士頓動力的母公司。