滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

圖森未來推視頻大模型Ruyi，跨界能否開辟新增長點？

時間：2024-12-18 06:04:12 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

圖森未來近日在自動駕駛領(lǐng)域之外邁出了重要一步，發(fā)布了其圖生視頻大模型Ruyi，并宣布將Ruyi-Mini-7B版本開源，供用戶在huggingface平臺上下載使用。這款產(chǎn)品的推出，標志著圖森未來正式進軍生成式AI應(yīng)用賽道，特別是動畫與視頻游戲市場。

據(jù)圖森未來工程高級副總裁李海泉介紹，Ruyi從今年8月開始研發(fā)，到12月初訓(xùn)練進入尾聲，并在內(nèi)部進行了多輪測試后才決定發(fā)布。這款模型需要用戶輸入一張圖片，并可選擇輸出時長、分辨率、運動幅度和鏡頭移動方向等參數(shù)，從而生成一個不超過5秒的視頻。李海泉表示，Ruyi特別擅長制作動漫，且動作更為絲滑，達到了每秒24幀的播放效果。

盡管Ruyi在技術(shù)上取得了一定的突破，但圖森未來也坦誠地指出了模型目前存在的問題，如手部畸形、多人面部細節(jié)崩壞以及不可控的轉(zhuǎn)場等。公司表示正在積極改進這些缺點，并計劃在日后的更新中進行修復(fù)。

對于自動駕駛和視頻模型之間的技術(shù)關(guān)聯(lián)，業(yè)內(nèi)存在不同的看法。一些自動駕駛從業(yè)者認為，從技術(shù)復(fù)用的角度來看，兩者互相搭不上邊。一家視頻模型公司的CTO也表示，視頻模型和自動駕駛在技術(shù)上或經(jīng)驗復(fù)用上沒有太大關(guān)系，圖森未來之所以能做，可能是基于市面上的開源模型收集了一些數(shù)據(jù)，門檻并不高。

然而，李海泉對此持不同意見。他認為，雖然自動駕駛領(lǐng)域的算法和規(guī)劃控制無法直接用于視頻模型，但在模型設(shè)計、數(shù)據(jù)處理和基礎(chǔ)工具類等方面還是有很多可以復(fù)用的東西。他強調(diào)，圖森未來在設(shè)計上確實參考了很多開源方案的實現(xiàn)，但這并不意味著要關(guān)起門來搞研發(fā)。

圖森未來之所以選擇進軍生成式AI應(yīng)用賽道，與其對市場的洞察密不可分。根據(jù)GIR的調(diào)研數(shù)據(jù)，全球文生視頻大模型市場在2023年的收入大約為720萬美元，預(yù)計到2030年將達到22.19億美元，年復(fù)合增長率有望達到56.6%。盡管視頻生成的技術(shù)成熟度還有待提高，實現(xiàn)規(guī)模性商業(yè)化也需要時間，但圖森未來認為，最佳應(yīng)用場景是孵化生成式AI工具的原動力。

圖森未來致力于利用大模型降低動漫和游戲內(nèi)容的開發(fā)周期和開發(fā)成本。Ruyi大模型已經(jīng)可以實現(xiàn)輸入關(guān)鍵幀后生成后續(xù)5秒的內(nèi)容，或輸入兩個關(guān)鍵幀由模型生成中間的過渡內(nèi)容，從而顯著降低開發(fā)周期。這與圖森未來想要入局的動畫與視頻游戲市場高度相關(guān)。

然而，并非所有人都對圖森未來的這一轉(zhuǎn)型持樂觀態(tài)度。有觀點認為，圖森未來是在賺吆喝，早期那些AI公司在大模型這波浪潮中可能跟不上節(jié)奏。圖森未來內(nèi)部也存在一些不穩(wěn)定因素，如持續(xù)的內(nèi)訌等。近日有投資人士透露，即將召開的圖森未來股東大會將決定公司下一階段的控制權(quán)。

盡管如此，李海泉仍表示，圖森未來將在12月19日詳細闡述AIGC業(yè)務(wù)、其他業(yè)務(wù)和自動駕駛業(yè)務(wù)如何整合等問題。這無疑為圖森未來的未來發(fā)展增添了一絲神秘色彩。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

01-12

谷歌加速AI布局，AI Studio團隊并入DeepMind力促項目提效

01-11

京東健康發(fā)布“AI京醫(yī)”大模型，分診準確率高達99.5%引領(lǐng)醫(yī)療智能化

01-11

微軟DirectX新動向：協(xié)作向量助力神經(jīng)渲染技術(shù)跨平臺發(fā)展

01-11

京東健康首推“AI京醫(yī)”體系，數(shù)字醫(yī)生24小時在線輔助診療

01-11

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

01-11

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

01-11

谷歌、OpenAI等巨頭搶購創(chuàng)作者未公開視頻，高價訓(xùn)練AI模型？

01-11

Meta陷版權(quán)風(fēng)波，扎克伯格被曝批AI團隊用盜版數(shù)據(jù)訓(xùn)練模型？

01-11

好大夫在線官宣：正式邁入螞蟻集團新時代！

三言科技1月11日消息，今日，在“2025好大夫峰會”上，好大夫在線創(chuàng)始人王航宣布好大夫正式加入螞蟻集團。 “我要正式向大家報告一個消息，好大夫在線已經(jīng)迎來全新的發(fā)展期，正式加入螞蟻集團，這是一場雙向奔赴，我…

01-11

螞蟻集團與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

01-11

扎克伯格炮轟蘋果：靠舊發(fā)明吃老本，創(chuàng)新乏力？

01-11

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

01-11

抖音重拳出擊！AI生成災(zāi)害場景，23652條不實信息被嚴處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應(yīng)用之路同樣偉大

01-11

點擊查看更多 +

全站最新

手機截圖小技巧：多種方法任你選，隱私安全需注意！

手機卡頓不用愁，這些妙招讓你手機流暢如新！

輕松掌握！手機電量顯示設(shè)置全攻略

比亞迪e7純電新車上演實力秀，簡約設(shè)計與強勁動力能否征服市場？

手機電量一目了然，設(shè)置教程來啦！輕松掌握電量情況

手機卡頓不用愁，這些妙招讓你手機重獲新生！

熱門內(nèi)容

本欄最新

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗！

京東健康發(fā)布“AI京醫(yī)”大模型，分診準確率高達99.5%引領(lǐng)醫(yī)療智能化

ChatGPT被用于開發(fā)自動射擊炮塔，OpenAI緊急叫停并封號

抖音重拳出擊！西藏地震后已清理2萬余條AI虛假災(zāi)害視頻

螞蟻集團與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

微軟rStar-Math技術(shù)助力，小語言模型數(shù)學(xué)推理能力大飛躍！

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

圖森未來推視頻大模型Ruyi，跨界能否開辟新增長點？

圖森未來推視頻大模型Ruyi，跨界能否開辟新增長點？