谷歌DeepMind重磅研究:通才版機(jī)器人AI智能體
站長之家(ChinaZ.com)6月21日 消息:谷歌DeepMind今日發(fā)布最新論文,介紹了一種名為“RoboCat”的自我提升機(jī)器人AI智能體。它會(huì)學(xué)習(xí)如何操縱各種機(jī)械臂以完成任務(wù),并生成新的訓(xùn)練數(shù)據(jù)來提高自身技術(shù),具備獨(dú)立學(xué)習(xí)和快速自我提升的能力。
RoboCat基于谷歌DeepMind的多模態(tài)模型Gato,相比其他最先進(jìn)的模型,學(xué)習(xí)速度更快,只需要100次演示就可以解決任務(wù),并從自己生成的數(shù)據(jù)中進(jìn)行改進(jìn)。谷歌DeepMind表示,這種能力將有助于加速機(jī)器人研究,因?yàn)樗鼫p少了對人類監(jiān)督訓(xùn)練的需求,是創(chuàng)造通用機(jī)器人的重要一步。
博客地址:https://www.deepmind.com/blog/robocat-a-self-improving-robotic-agent
此前,研究人員已經(jīng)探索了如何開發(fā)能夠大規(guī)模學(xué)習(xí)多種任務(wù)的機(jī)器人,并將對語言模型的理解與輔助機(jī)器人的現(xiàn)實(shí)世界能力相結(jié)合。RoboCat是第一個(gè)解決和適應(yīng)多重任務(wù)的智能體,并且是在不同的真實(shí)機(jī)器人之間進(jìn)行完成的。
隨著RoboCat進(jìn)一步學(xué)習(xí)新的任務(wù),它將越來越擅長學(xué)習(xí)更多的新任務(wù)。在每個(gè)任務(wù)學(xué)習(xí)了500次演示之后,最初版本的RoboCat在以前沒見過的任務(wù)上只有36%的成功率。但最新版本的RoboCat經(jīng)過更多樣化的任務(wù)訓(xùn)練后,在相同任務(wù)上的成功率提高了兩倍多。