【ITBEAR科技資訊】9月6日消息,阿里云近日發(fā)布了一款創(chuàng)新的視頻生成大模型,名為I2VGen-XL,并已在魔搭社區(qū)開放體驗(yàn)。這一模型的推出引起了廣泛的關(guān)注,因?yàn)樗梢栽谟脩羯蟼饕粡垐D片后,僅需短短的2分鐘左右,就能夠生成一段高分辨率的1280*720視頻。不僅如此,該模型的研發(fā)團(tuán)隊(duì)還表示,未來(lái)將進(jìn)一步提升效果,實(shí)現(xiàn)2K超清畫質(zhì),以滿足更多領(lǐng)域的需求,包括短視頻內(nèi)容制作和電影制作等。
據(jù)ITBEAR科技資訊了解,與目前熱門的AI繪畫創(chuàng)作大模型不同,視頻生成大模型面臨更高的技術(shù)挑戰(zhàn)。它需要克服文本與視頻內(nèi)容的匹配度問(wèn)題,確保生成視頻的畫面質(zhì)量和連貫性。此前,阿里云以及微軟等科技巨頭相繼推出了一系列可控視頻生成的研究成果,允許用戶通過(guò)定義空間布局、運(yùn)動(dòng)模式等條件來(lái)生成視頻,但畫面清晰度難以滿足真實(shí)場(chǎng)景應(yīng)用的需求。
目前,I2VGen-XL的模型和代碼已經(jīng)開源,國(guó)內(nèi)外社交媒體上出現(xiàn)了大量用戶和開發(fā)者的創(chuàng)意AI視頻生成內(nèi)容。例如,一些用戶創(chuàng)造了城堡上展翅的恐龍和宇航員在飛船中行走的科幻電影畫面等。這一創(chuàng)新在視覺(jué)生成領(lǐng)域取得了顯著的進(jìn)展,此前阿里云已推出了通義萬(wàn)相(基座模型Composer)和可控視頻生成模型VideoComposer,團(tuán)隊(duì)在該領(lǐng)域發(fā)表了60多篇CCF-A類論文,并在國(guó)際頂級(jí)視覺(jué)競(jìng)賽中贏得了10余項(xiàng)冠軍。
這一新模型的發(fā)布為視頻內(nèi)容創(chuàng)作領(lǐng)域帶來(lái)了全新的可能性,將進(jìn)一步推動(dòng)AI技術(shù)在影視制作和短視頻領(lǐng)域的應(yīng)用發(fā)展。隨著模型的不斷優(yōu)化和開源,我們可以期待看到更多創(chuàng)意和多樣化的視頻內(nèi)容涌現(xiàn)。