即夢AI在官方社交媒體平臺上震撼發(fā)布了一則關(guān)于全新功能即將上線的預(yù)告,引發(fā)廣泛關(guān)注。這項名為OmniHuman的多模態(tài)視頻生成模型,憑借其獨特的技術(shù)魅力,為用戶帶來了前所未有的視頻創(chuàng)作體驗。用戶只需簡單地上傳一張圖片和一段音頻,OmniHuman便能迅速生成一條栩栩如生、充滿活力的AI視頻,極大地提升了AI短片制作的效率與質(zhì)量。
據(jù)透露,OmniHuman是字節(jié)跳動公司自主研發(fā)的閉源模型,其技術(shù)主頁詳細(xì)介紹了該模型的強(qiáng)大功能。無論是肖像、半身還是全身等不同尺寸的圖片輸入,OmniHuman都能根據(jù)音頻內(nèi)容,在視頻中讓人物呈現(xiàn)出與之相匹配的動作,如演講、唱歌、樂器演奏以及行走等。這一技術(shù)不僅解決了人物視頻生成中常見的手勢崩壞問題,還顯著提升了生成視頻的自然度。
OmniHuman在動漫、3D卡通等非真人圖片輸入方面也展現(xiàn)出了卓越的表現(xiàn)。它能夠保持特定風(fēng)格和原有的運動模式,生成的視頻效果令人驚嘆。這一技術(shù)的突破,無疑為視頻創(chuàng)作者提供了更多的創(chuàng)作可能性和想象空間。
為了防止這項技術(shù)被濫用,字節(jié)跳動技術(shù)團(tuán)隊在OmniHuman的技術(shù)主頁上特別注明,該模型將不會對外提供下載。這一舉措不僅體現(xiàn)了字節(jié)跳動對技術(shù)安全的重視,也彰顯了其作為科技企業(yè)的社會責(zé)任感。
即夢AI的相關(guān)負(fù)責(zé)人表示,盡管OmniHuman已經(jīng)展現(xiàn)出了出色的表現(xiàn),但在生成影視真實級別的視頻方面,仍存在一定的提升空間。因此,該模型支持的多模態(tài)視頻生成功能將首先在即夢平臺上進(jìn)行小范圍內(nèi)測,以便進(jìn)行進(jìn)一步的調(diào)優(yōu)和調(diào)整。同時,即夢還將為這一功能設(shè)置嚴(yán)格的安全審核機(jī)制,并對輸出的視頻標(biāo)注水印,以確保AI技術(shù)的正面應(yīng)用和積極作用。
隨著OmniHuman技術(shù)的不斷成熟和完善,相信它將為視頻創(chuàng)作者帶來更多的驚喜和靈感。同時,即夢AI也將繼續(xù)致力于技術(shù)創(chuàng)新和用戶體驗的提升,為用戶提供更加優(yōu)質(zhì)、便捷的視頻創(chuàng)作服務(wù)。