meta公司近期在人工智能領(lǐng)域邁出了重要一步,推出了名為meta Motivo的創(chuàng)新模型。該模型專注于控制類人數(shù)字智能體的動(dòng)作,旨在為用戶帶來(lái)更加沉浸式的元宇宙體驗(yàn)。
在周四的發(fā)布會(huì)上,meta不僅展示了meta Motivo,還介紹了其他兩項(xiàng)AI工具:大型概念模型LCM和視頻水印工具Video Seal。這些舉措再次表明了meta對(duì)于AI、增強(qiáng)現(xiàn)實(shí)(AR)以及元宇宙技術(shù)的持續(xù)投資與承諾。
meta Motivo是一個(gè)基于行為的基礎(chǔ)模型,它的訓(xùn)練過(guò)程充滿了技術(shù)含量。模型在Mujoco模擬器中得到了充分的鍛煉,使用了AMASS動(dòng)作捕捉數(shù)據(jù)集的一個(gè)子集,并結(jié)合了3000萬(wàn)個(gè)在線交互樣本。通過(guò)一種新型的無(wú)監(jiān)督強(qiáng)化學(xué)習(xí)算法,meta Motivo能夠預(yù)訓(xùn)練并控制復(fù)雜虛擬人形智能體的運(yùn)動(dòng)。
在訓(xùn)練過(guò)程中,meta Motivo采用了一種名為FB-CPR的算法。這種算法能夠利用未標(biāo)記的動(dòng)作數(shù)據(jù)集,不僅保留了零樣本推理能力,還能將無(wú)監(jiān)督強(qiáng)化學(xué)習(xí)引導(dǎo)至學(xué)習(xí)類似人類的行為。這一技術(shù)創(chuàng)新使得meta Motivo在動(dòng)作軌跡跟蹤、姿勢(shì)到達(dá)以及獎(jiǎng)勵(lì)優(yōu)化等任務(wù)上,展現(xiàn)出了更加接近人類的行為。
值得注意的是,盡管meta Motivo沒(méi)有經(jīng)過(guò)任何特定任務(wù)的顯式訓(xùn)練,但在預(yù)訓(xùn)練過(guò)程中,它在多個(gè)任務(wù)上的性能都得到了顯著提升。例如,在動(dòng)作軌跡跟蹤方面,它能夠準(zhǔn)確地進(jìn)行側(cè)手翻等動(dòng)作;在姿勢(shì)到達(dá)方面,它能夠呈現(xiàn)出如阿拉貝斯克舞姿般的優(yōu)雅姿態(tài);在獎(jiǎng)勵(lì)優(yōu)化方面,它的跑步動(dòng)作也更加自然流暢。
meta Motivo的成功離不開(kāi)其關(guān)鍵技術(shù)創(chuàng)新——學(xué)習(xí)表示。這種表示能夠?qū)顟B(tài)、動(dòng)作和獎(jiǎng)勵(lì)嵌入到相同的潛在空間中,使得meta Motivo能夠解決各種全身控制任務(wù)。無(wú)論是運(yùn)動(dòng)跟蹤、目標(biāo)姿態(tài)到達(dá)還是獎(jiǎng)勵(lì)優(yōu)化,meta Motivo都無(wú)需任何額外的訓(xùn)練或規(guī)劃,就能展現(xiàn)出出色的表現(xiàn)。
meta的這一系列舉措無(wú)疑將推動(dòng)元宇宙技術(shù)的發(fā)展,為用戶帶來(lái)更加真實(shí)、沉浸的虛擬體驗(yàn)。隨著meta在AI領(lǐng)域的不斷探索和投入,我們有理由相信,未來(lái)的元宇宙將更加豐富多彩、充滿無(wú)限可能。