ITBear旗下自媒體矩陣:

復(fù)旦與百度聯(lián)手發(fā)布Hallo2 AI模型,4K人物動畫數(shù)小時速成

   時間:2024-10-21 19:45:30 來源:ITBEAR作者:馮璃月編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】復(fù)旦大學(xué)與百度強(qiáng)強(qiáng)聯(lián)手,成功研發(fā)出革命性AI模型——Hallo2,該模型在視頻生成技術(shù)上取得了里程碑式的突破,能夠生成分辨率高達(dá)4K、時長可達(dá)數(shù)小時的人物動畫。這一創(chuàng)新成果已在GitHub平臺開源,供全球開發(fā)者免費(fèi)使用,旨在推動視頻生成技術(shù)的普及與進(jìn)步。

Hallo2模型的核心亮點(diǎn)在于其引入了可調(diào)整的語義文本標(biāo)簽肖像表情作為條件輸入,顯著提升了生成內(nèi)容的可控性和多樣性。這一特性使得Hallo2成為業(yè)界首個實(shí)現(xiàn)4K分辨率、長達(dá)1小時音頻驅(qū)動人像圖像動畫的AI模型。

在電影和視頻制作領(lǐng)域,Hallo2能夠生成或增強(qiáng)角色的面部表情和口型,為科幻和動畫電影提供新的創(chuàng)作手段。同時,在虛擬助手和數(shù)字人領(lǐng)域,Hallo2也能發(fā)揮重要作用,創(chuàng)建逼真的虛擬形象,提升用戶體驗(yàn)。

技術(shù)層面,Hallo2基于latent diffusion models構(gòu)建,在視頻生成效果上較前代模型有顯著提升。通過引入數(shù)據(jù)增強(qiáng)技術(shù),如patch-drop和高斯噪聲,Hallo2有效提升了長時間視頻的視覺一致性和時間連貫性。結(jié)合向量量化生成對抗網(wǎng)絡(luò)和時間對齊技術(shù),Hallo2確保了視頻的高質(zhì)量與流暢性。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容