ITBear旗下自媒體矩陣:

阿里通義萬相2.1大升級:視頻圖像生成能力顯著增強,中文文字視頻首亮相

   時間:2025-01-10 11:56:52 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

阿里巴巴旗下的通義萬相近日宣布了其2.1版本模型的重大升級,此次升級在視頻與圖像生成能力上實現(xiàn)了顯著提升,為用戶帶來了更為豐富和高質(zhì)量的創(chuàng)作體驗。

在視頻生成領(lǐng)域,通義萬相2.1憑借自研的高效VAE和DiT架構(gòu),顯著增強了時空上下文建模能力。這一技術(shù)突破使得系統(tǒng)能夠支持無限長1080P視頻的高效編解碼,大大提升了視頻處理的靈活性和效率。尤為新版本首次實現(xiàn)了中文文字視頻生成功能,并在VBench榜單上榮登榜首,彰顯了其在視頻生成技術(shù)上的領(lǐng)先地位。

通義萬相2.1不僅支持中英文視頻的一鍵藝術(shù)字生成,還提供了多種視頻特效選項,如過渡效果、粒子效果和模擬效果等,極大地豐富了視頻的視覺表現(xiàn)力。無論是制作宣傳視頻還是個人短片,用戶都能輕松實現(xiàn)專業(yè)級的視覺效果。

在圖像生成方面,通義萬相2.1同樣表現(xiàn)出色。新版本采用了IC-LoRA圖像生成訓練方法,結(jié)合DiT架構(gòu),顯著增強了文本到圖像的上下文能力。用戶只需對多張圖像進行拼接與聯(lián)合描述,即可實現(xiàn)關(guān)聯(lián)圖像間的組合生成,并保持特征穩(wěn)定連續(xù)。這一功能為設(shè)計師和攝影師提供了更多創(chuàng)意空間,讓圖像創(chuàng)作更加便捷和高效。

通義萬相2.1還支持復(fù)雜運鏡,能夠還原碰撞、反彈、切割、擠壓等真實世界的物理規(guī)律。例如,在模擬雨滴落在傘面上的場景中,系統(tǒng)能夠精確呈現(xiàn)水花濺起的細節(jié),使畫面更加逼真和生動。這一功能在廣告制作、動畫制作等領(lǐng)域具有廣泛的應(yīng)用前景。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version