ITBear旗下自媒體矩陣:

RoboCat:首個(gè)能夠解決和適應(yīng)多種任務(wù)的人工智能模型問世

   時(shí)間:2023-06-26 11:47:17 來源:ITBEAR編輯:茹茹 發(fā)表評(píng)論無障礙通道

【ITBEAR科技資訊】6月26日消息,谷歌旗下的DeepMind公司近日宣布成功研發(fā)出一種名為RoboCat的人工智能模型,該模型具備多任務(wù)解決和適應(yīng)的能力,并能夠通過不同的真實(shí)世界機(jī)器人完成任務(wù)。這一突破性進(jìn)展為機(jī)器人技術(shù)領(lǐng)域帶來了新的可能性。

RoboCat的靈感來自DeepMind的另一款A(yù)I模型Gato,后者具備文本、圖像和事件分析與處理的能力。為了訓(xùn)練RoboCat,研究人員采集了模擬和真實(shí)機(jī)器人的圖像和動(dòng)作數(shù)據(jù),其中包括來自虛擬環(huán)境中其他機(jī)器人控制模型、人類控制機(jī)器人以及RoboCat早期版本的數(shù)據(jù)。

據(jù)ITBEAR科技資訊了解,RoboCat的訓(xùn)練過程包括以下幾個(gè)步驟:首先,研究人員利用人類控制的機(jī)械臂在模擬或真實(shí)環(huán)境中進(jìn)行每個(gè)任務(wù)或機(jī)器人的100到1000次演示,例如拾取齒輪或堆疊積木等。隨后,他們對(duì)RoboCat進(jìn)行微調(diào),針對(duì)每個(gè)任務(wù)創(chuàng)建專門的"衍生"模型,并進(jìn)行平均約1萬次的訓(xùn)練。通過結(jié)合衍生模型生成的數(shù)據(jù)和演示數(shù)據(jù),研究人員不斷擴(kuò)大RoboCat的訓(xùn)練數(shù)據(jù)集,并訓(xùn)練出新的RoboCat版本。

最終,RoboCat在模擬和真實(shí)世界中完成了總共253個(gè)任務(wù)的訓(xùn)練,并在這些任務(wù)的141個(gè)變體上進(jìn)行了測(cè)試。DeepMind表示,在觀察了1000次人類控制的演示后,RoboCat學(xué)會(huì)了操作不同類型的機(jī)械臂。盡管RoboCat已經(jīng)在四種具有兩爪臂的機(jī)器人上進(jìn)行了訓(xùn)練,但該模型也能夠適應(yīng)一種更復(fù)雜的機(jī)械臂,該機(jī)械臂具備三指夾具和更多的可控輸入。

不過,RoboCat在DeepMind的測(cè)試中在不同任務(wù)上的成功率存在較大差異,最低成功率為13%,最高可達(dá)99%。這些結(jié)果是基于1000次演示的訓(xùn)練數(shù)據(jù)得出的,如果演示次數(shù)減半,成功率也會(huì)相應(yīng)降低。但在某些情況下,DeepMind聲稱RoboCat只需觀察100次演示即可學(xué)習(xí)新任務(wù)。DeepMind的研究科學(xué)家李亞歷克斯表示,RoboCat有望進(jìn)一步降

低學(xué)習(xí)新任務(wù)的難度。他表示,只要提供一定數(shù)量的新任務(wù)演示,RoboCat就能夠進(jìn)行微調(diào),并自動(dòng)生成更多數(shù)據(jù)以進(jìn)一步提升性能。研究團(tuán)隊(duì)的未來目標(biāo)是減少RoboCat學(xué)習(xí)新任務(wù)所需的演示次數(shù),使之少于10次,以進(jìn)一步提高效率和適應(yīng)性。這一研究成果對(duì)于推動(dòng)機(jī)器人技術(shù)的發(fā)展具有重要意義,為機(jī)器人在各個(gè)領(lǐng)域的應(yīng)用打開了更廣闊的前景。


標(biāo)簽: 谷歌
舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version