【ITBEAR】復(fù)旦大學(xué)與百度攜手推出全新AI模型Hallo2,該模型已正式在GitHub開源。Hallo2能夠生成長達數(shù)小時的4K高清人物動畫,為AI動畫領(lǐng)域帶來重大突破。
基于latent diffusion models構(gòu)建,Hallo2在視覺效果上超越前代,特別支持長視頻生成。通過引入patch-drop和高斯噪聲等數(shù)據(jù)增強方法,該模型顯著提升了長時間視頻的視覺一致性和時間連貫性。
Hallo2還融合了向量量化生成對抗網(wǎng)絡(luò)和時間對齊技術(shù),確保高分辨率視頻的質(zhì)量與流暢度。該模型創(chuàng)新性地將可調(diào)整的語義文本標簽肖像表情作為條件輸入,不僅提高了可控性,還豐富了生成內(nèi)容的多樣性。
Hallo2項目詳情,請訪問:https://fudan-generative-vision.github.io/hallo2/#/