波士頓動(dòng)力推出 AI 集成的機(jī)器人狗 Spot:打造未來(lái)互動(dòng)導(dǎo)游
微新創(chuàng)想(idea2003.com) 10 月 27 日消息:波士頓動(dòng)力公司近日推出了其新一代機(jī)器人狗 Spot,這是一種配備了聊天機(jī)器人技術(shù)的智能導(dǎo)游機(jī)器人。Spot 不僅能走動(dòng)和交談,還能以其獨(dú)特的英國(guó)口音為游客提供場(chǎng)所導(dǎo)游服務(wù)。通過(guò)與 ChatGPT 及其他開(kāi)源大型語(yǔ)言模型(LLMs)的集成,Spot 能夠精準(zhǔn)地訓(xùn)練其響應(yīng),為人們呈現(xiàn)出一個(gè)全新的互動(dòng)體驗(yàn)。
據(jù)波士頓動(dòng)力的工程師介紹,Spot 能夠通過(guò)編寫(xiě)好的對(duì)話和視覺(jué)問(wèn)答模型,來(lái)回答有關(guān)周?chē)h(huán)境的問(wèn)題。在 YouTube 上發(fā)布的演示視頻中,Spot 可以看到在波士頓動(dòng)力的設(shè)施中走動(dòng),為觀眾展示周?chē)沫h(huán)境,并通過(guò)其機(jī)械口回答問(wèn)題,營(yíng)造出一種真實(shí)的交流體驗(yàn)。
波士頓動(dòng)力的首席軟件工程師 Matt Klingensmith 表示,他們?yōu)?Spot 的每個(gè)房間提供了簡(jiǎn)短的腳本。Spot 隨后利用其抓手和身體上的攝像頭收集房間的圖像,以獲取更多有關(guān)所見(jiàn)內(nèi)容的信息,然后生成響應(yīng)。視覺(jué)問(wèn)答模型讓 Spot 能夠?yàn)閳D像添加標(biāo)題并回答關(guān)于它們的問(wèn)題。
波士頓動(dòng)力的機(jī)器人常常展示其舞蹈和跑酷技能,但通過(guò)生成式 AI,它們現(xiàn)在能夠直接聽(tīng)取并回應(yīng)人類的輸入。這些機(jī)器人擁有多種人格,包括一個(gè)激動(dòng)地談?wù)摽赡茉谑^下找到的礦物的「貴金屬女牛仔」,一個(gè)以押韻對(duì)偶回應(yīng)的「莎士比亞時(shí)空旅行者」,以及一個(gè)嘲諷 Klingensmith 的「Josh」人格。
Klingensmith 在波士頓動(dòng)力官方博客中寫(xiě)道:「我們很高興繼續(xù)探索人工智能與機(jī)器人技術(shù)的交匯點(diǎn)。這些模型(LLMs)可以提供文化背景、常識(shí)知識(shí)和靈活性,這對(duì)于許多機(jī)器人任務(wù)來(lái)說(shuō)都可能很有用。例如,僅通過(guò)與機(jī)器人交談就能指派任務(wù),這將有助于降低使用這些系統(tǒng)的學(xué)習(xí)曲線。」
同時(shí),OpenAI 最近也為其聊天機(jī)器人 ChatGPT 添加了聲音和圖像識(shí)別功能,讓它能夠生成由真人聲音演員的聲音合成的 AI 生成的聲音線,從而能夠向用戶回應(yīng)。此外,ChatGPT 現(xiàn)在也能識(shí)別圖像,并提供圖像中內(nèi)容的信息。這一更新也為 AI 的可能性打開(kāi)了新的大門(mén),包括波士頓的機(jī)器人狗,現(xiàn)在也能夠聽(tīng)和說(shuō)了。