滾動資訊

即夢AI新技能：圖+音合成視頻，內測即將開啟！

時間：2025-02-07 18:35:14 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近日，即夢AI在官方社交媒體平臺上發(fā)布了一則令人矚目的消息，預告了其即將上線的新功能。這項功能的核心在于一個名為OmniHuman的多模態(tài)視頻生成模型，該模型由字節(jié)跳動自主研發(fā)，旨在通過用戶提供的單張圖片和音頻文件，自動生成富有生動感的AI視頻。

根據即夢AI發(fā)布的預告視頻顯示，OmniHuman模型的應用場景極為廣泛。用戶只需簡單地上傳一張包含人物肖像、半身或全身的圖片，并搭配一段音頻，模型便能在視頻中讓該人物根據音頻內容做出相應的動作，無論是演講、唱歌、演奏樂器還是移動，都能呈現得栩栩如生。這一技術有望極大地提升AI短片的制作效率和質量。

OmniHuman模型在解決人物視頻生成中常見的手勢崩壞問題上，相較于現有方法取得了顯著的進步。該模型還支持非真人圖片輸入，如動漫、3D卡通等，生成的視頻能夠保持輸入圖片的特定風格和原有的運動模式，這一特性無疑為創(chuàng)作者提供了更多的可能性。

據即夢AI技術主頁的信息顯示，OmniHuman模型為閉源模型，這意味著它不會對外公開下載。這一決策可能是為了防止該技術被不當利用。同時，從技術主頁展示的演示效果來看，OmniHuman的生成效果已經相當自然，令人印象深刻。

盡管OmniHuman模型已經表現出色，但即夢AI的相關負責人透露，該模型在生成影視真實級別的視頻上仍存在一定的提升空間。因此，由該模型支持的多模態(tài)視頻生成功能將在即夢平臺上以小范圍內測的形式進行調優(yōu)調整，并逐步向用戶開放。

為了確保AI技術的正面應用，即夢AI還宣布將對此功能設置嚴格的安全審核機制，并對輸出的視頻標注水印以作提醒。這一舉措旨在保障視頻創(chuàng)作者能夠更好地實現想象力的表達，同時防止技術被濫用。

隨著OmniHuman模型的逐步推廣和應用，我們有理由相信，AI視頻生成技術將迎來一個全新的發(fā)展階段，為視頻創(chuàng)作者提供更多元化、更高效的創(chuàng)作工具。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

洛陽新添防水科技強企，東方雨虹等聯(lián)合投資成立優(yōu)鑫雨虹

02-07

青龍管業(yè)攜手合作伙伴成立新科技公司，涉足智能儀器儀表制造領域

02-07

Sionna今晚納斯達克上市，募資1.9億美金挑戰(zhàn)囊性纖維化治療巨頭Vertex

02-07

中小型文博機構如何破局？積木易搭“互聯(lián)網+文博”信息化方案來襲

02-07

2024中國移動智慧屏市場火爆，小度添添閨蜜機蟬聯(lián)銷冠！

02-07

英特爾困境：服務器處理器銷量連跌三年，創(chuàng)14年新低！

02-07

慧榮科技2024年財報亮點：營收大增，PCIe Gen5芯片將放量生產

02-07

索泰RTX 5080顯卡深度評測：與5090相似度極高，超頻后性能如何？

02-07

DeepSeek爆火！一周訪問量趕超Gemini兩年積累

02-07

微軟“如何卸載Edge”指南藏玄機，Edge瀏覽器究竟有何魅力？

02-07

蘇泊爾養(yǎng)生壺，多功能又實惠，79元搶購倒計時！

02-07

《哪吒2》票房破62億！導演餃子能分到多少收益？

02-07

《你的顏色》：山田尚子新作，2月21日帶你走進色彩與音樂的青春世界！

02-07

文遠知行Robovan W5：高性能無人物流車，物流配送新未來？

02-07

RTX 4060供貨驟減60%，消費者該加價搶購還是靜候RTX 5060？

02-07

點擊查看更多 +

全站最新

捷途自由者2月14日預售，燃油版山海T1來襲，1.5T與2.0T動力任選

《王者榮耀》新英雄空空兒登場，古彩戲法加持，操作難度再升級！

萬代南夢宮一年間裁員超百人，背后真相究竟如何？

《血源詛咒》粉絲項目遭索尼警告，背后原因引發(fā)社區(qū)熱議

第四范式配售新H股，最高募資14億！先知AI平臺成業(yè)績增長引擎

Sionna今晚納斯達克上市，募資1.9億美金挑戰(zhàn)囊性纖維化治療巨頭Vertex

熱門內容

本欄最新

Sionna今晚納斯達克上市，募資1.9億美金挑戰(zhàn)囊性纖維化治療巨頭Vertex

中小型文博機構如何破局？積木易搭“互聯(lián)網+文博”信息化方案來襲

2024中國移動智慧屏市場火爆，小度添添閨蜜機蟬聯(lián)銷冠！

英特爾困境：服務器處理器銷量連跌三年，創(chuàng)14年新低！

慧榮科技2024年財報亮點：營收大增，PCIe Gen5芯片將放量生產

索泰RTX 5080顯卡深度評測：與5090相似度極高，超頻后性能如何？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

即夢AI新技能：圖+音合成視頻，內測即將開啟！

即夢AI新技能：圖+音合成視頻，內測即將開啟！