滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

國產(chǎn)AI視頻大模型群雄逐鹿，Sora能否后來居上？

時間：2024-12-11 13:03:11 來源：ITBEAR編輯：快訊團(tuán)隊 發(fā)表評論無障礙通道

在AI技術(shù)日新月異的當(dāng)下，視頻大模型領(lǐng)域迎來了前所未有的發(fā)展浪潮。繼OpenAI發(fā)布其視頻大模型Sora Turbo之后，盡管其支持的生成視頻時長僅為最初宣傳的三分之一，且仍處于小范圍測試階段，但這并未阻擋國內(nèi)AI企業(yè)在此領(lǐng)域的快速推進(jìn)。

今年2月，Sora的首次亮相標(biāo)志著視頻大模型行業(yè)的黃金發(fā)展期正式開啟。然而，令人意想不到的是，作為行業(yè)推動者的Sora，在國內(nèi)市場卻面臨了激烈的競爭，甚至顯得有些掉隊。國內(nèi)市場上，騰訊、阿里巴巴、字節(jié)跳動等互聯(lián)網(wǎng)巨頭紛紛推出了自己的AI視頻大模型，市場上一時間涌現(xiàn)出了不下二十款同類產(chǎn)品。

AI視頻大模型不僅賦予了AI更強(qiáng)大的理解和重構(gòu)真實世界的能力，也為用戶提供了無限的想象空間。與泛用場景的大語言模型不同，視頻大模型的使用場景更為專業(yè)，因此現(xiàn)階段多需要付費才能隨心生成視頻。免費用戶通常只能依靠系統(tǒng)積分或每日贈送的次數(shù)生成視頻，且可能無法體驗部分高階功能。

在眾多國內(nèi)AI視頻大模型中，快手科技旗下的可靈無疑是先行者之一，其體驗在眾多模型中名列前茅。可靈支持文生視頻和圖片生成視頻兩種模式，且能夠調(diào)整創(chuàng)意想象力和創(chuàng)意相關(guān)性。用戶可以通過文字描述生成最高5秒的高品質(zhì)視頻，或通過圖片生成最高10秒的標(biāo)準(zhǔn)品質(zhì)視頻，并支持運鏡調(diào)節(jié)。一段描述寧靜海灘的視頻生成后，無論是風(fēng)吹椰子樹的細(xì)節(jié)，還是貓咪舔舐毛發(fā)的動作，都表現(xiàn)得相當(dāng)出色，盡管生成的視頻場景是在白天而非夜晚。

抖音也不甘落后，推出了自己的視頻大模型即夢。即夢除了支持文生視頻和圖生視頻外，還加入了對口型功能，能夠根據(jù)文本或錄音調(diào)整視頻。即夢更新迭代速度極快，目前已有多個版本可用。通過即夢生成的視頻質(zhì)量也相當(dāng)不錯，但貓咪的動作略顯單調(diào)和僵硬，樹葉也未隨風(fēng)而動。

騰訊推出的混元視頻大模型則略顯稚嫩，生成的視頻質(zhì)量不如可靈和即夢。騰訊混元目前僅支持文生視頻，且每日免費生成次數(shù)有限。生成的視頻中，月亮顯得過于虛假，貓咪的動作也充滿了違和感。

北京數(shù)生科技與清華大學(xué)聯(lián)合研發(fā)的Vidu大模型則表現(xiàn)出了不俗的實力。Vidu支持文生視頻和圖生視頻，還能根據(jù)同一主體不同角度的圖片生成更具真實感的立體畫面。生成的視頻質(zhì)量高，運鏡自然流暢，細(xì)節(jié)豐富，唯一的漏洞在于沙灘的質(zhì)感稍顯不足。

智譜清言開發(fā)的清影大模型雖然功能豐富，但生成的視頻質(zhì)量卻令人失望。畫面中幾乎看不到貓咪的存在，更像是一張靜態(tài)圖片。與同門師兄弟Vidu相比，清影在自然語言理解能力上還有待提升。

愛詩科技的PixVerse大模型則以其唯美的畫面風(fēng)格吸引了眼球。生成的視頻中，小貓的毛發(fā)細(xì)節(jié)和水面的波紋都表現(xiàn)得十分到位，但貓咪的動作卻顯得有些僵硬。盡管如此，PixVerse的表現(xiàn)依然令人印象深刻。

從當(dāng)前的市場表現(xiàn)來看，國內(nèi)AI視頻大模型領(lǐng)域已呈現(xiàn)出群雄逐鹿的態(tài)勢。盡管各模型在細(xì)節(jié)上還存在一定的不足，但整體實力已不容小覷。未來，隨著技術(shù)的不斷進(jìn)步和市場的日益成熟，AI視頻大模型有望在更多領(lǐng)域發(fā)揮重要作用。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

01-12

谷歌加速AI布局，AI Studio團(tuán)隊并入DeepMind力促項目提效

01-11

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

01-11

微軟DirectX新動向：協(xié)作向量助力神經(jīng)渲染技術(shù)跨平臺發(fā)展

01-11

京東健康首推“AI京醫(yī)”體系，數(shù)字醫(yī)生24小時在線輔助診療

01-11

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

01-11

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

01-11

谷歌、OpenAI等巨頭搶購創(chuàng)作者未公開視頻，高價訓(xùn)練AI模型？

01-11

Meta陷版權(quán)風(fēng)波，扎克伯格被曝批AI團(tuán)隊用盜版數(shù)據(jù)訓(xùn)練模型？

01-11

好大夫在線官宣：正式邁入螞蟻集團(tuán)新時代！

三言科技1月11日消息，今日，在“2025好大夫峰會”上，好大夫在線創(chuàng)始人王航宣布好大夫正式加入螞蟻集團(tuán)。 “我要正式向大家報告一個消息，好大夫在線已經(jīng)迎來全新的發(fā)展期，正式加入螞蟻集團(tuán)，這是一場雙向奔赴，我…

01-11

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

01-11

扎克伯格炮轟蘋果：靠舊發(fā)明吃老本，創(chuàng)新乏力？

01-11

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

01-11

抖音重拳出擊！AI生成災(zāi)害場景，23652條不實信息被嚴(yán)處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應(yīng)用之路同樣偉大

01-11

點擊查看更多 +

全站最新

奇瑞風(fēng)云T8預(yù)售大熱，C-DM5.0混動能否開啟國民車新篇章？

手機(jī)充電加速秘籍：環(huán)境、方式、設(shè)置三管齊下，告別電量焦慮！

手機(jī)無法開機(jī)怎么辦？一文教你輕松解決開機(jī)難題！

手機(jī)號凍結(jié)全攻略：步驟、注意事項一網(wǎng)打盡

一汽奧迪2025年攻堅前行，五款新車齊發(fā)，續(xù)寫豪華新篇章

九號攜手AG超玩會，共鑄2024王者榮耀挑戰(zhàn)者杯三冠傳奇！

熱門內(nèi)容

本欄最新

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

國產(chǎn)AI視頻大模型群雄逐鹿，Sora能否后來居上？

國產(chǎn)AI視頻大模型群雄逐鹿，Sora能否后來居上？