滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

圖森未來發(fā)布Ruyi視頻大模型，消費級顯卡即可運行

時間：2024-12-17 13:11:01 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

圖森未來近期在人工智能領(lǐng)域邁出了重要一步，正式推出了名為“Ruyi”的圖生視頻大模型，并慷慨地將Ruyi-Mini-7B版本向公眾開源，用戶現(xiàn)可通過huggingface平臺輕松下載并使用這一創(chuàng)新工具。

Ruyi是一款基于DiT架構(gòu)的視頻生成模型，其設(shè)計理念獨特，由兩大核心模塊構(gòu)成：一是Casual VAE模塊，負(fù)責(zé)高效處理視頻數(shù)據(jù)的壓縮與解壓；二是Diffusion Transformer模塊，專注于生成經(jīng)過壓縮的視頻內(nèi)容。這款模型擁有約71億個參數(shù)，經(jīng)過大量訓(xùn)練，涉及約2億個視頻片段，旨在為用戶提供前所未有的視頻生成體驗。

圖森未來在設(shè)計Ruyi時，充分考慮了用戶的實際需求，特別優(yōu)化了模型在消費級顯卡上的運行效率，如RTX 4090等，確保用戶無需高端硬件也能輕松體驗。Ruyi還配備了詳盡的部署指南和ComfyUI工作流，即便是初次接觸的用戶也能迅速上手。

Ruyi的功能性同樣令人矚目，支持多分辨率、多時長的視頻生成，分辨率范圍從384*384到1024*1024，任意長寬比，最長可達(dá)120幀或5秒的視頻內(nèi)容。用戶還可通過控制首幀和首尾幀來定制視頻，最多可設(shè)置5個起始幀和5個結(jié)束幀，通過循環(huán)疊加，實現(xiàn)任意長度的視頻創(chuàng)作。

更Ruyi還提供了4檔運動幅度控制和5種鏡頭控制選項，包括上、下、左、右移動和靜止，使用戶能夠更精細(xì)地調(diào)控畫面變化和鏡頭切換，為視頻創(chuàng)作增添更多可能性。

然而，Ruyi目前仍存在一些不足，如手部動作可能顯得不夠自然，多人場景中的面部細(xì)節(jié)有時會出現(xiàn)失真，以及不可預(yù)測的轉(zhuǎn)場效果。圖森未來對此表示，團隊正在積極改進(jìn)這些缺點，并計劃在未來的更新中逐步修復(fù)。

圖森未來強調(diào)，Ruyi的發(fā)布旨在利用大模型技術(shù)縮短動漫和游戲內(nèi)容的開發(fā)周期，降低制作成本。目前，Ruyi已經(jīng)能夠根據(jù)用戶輸入的關(guān)鍵幀，自動生成接下來的5秒內(nèi)容，或根據(jù)兩個關(guān)鍵幀生成中間的過渡畫面，極大地提升了創(chuàng)作效率。未來，圖森未來還將推出更多版本的Ruyi，以滿足不同創(chuàng)作者的多樣化需求。

對于想要探索Ruyi-Mini-7B版本的開發(fā)者，可以訪問以下開源鏈接：

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

12-19

天陽科技與SS&C攜手，億元打造Algorithmics軟件獨家信創(chuàng)版

12-19

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費產(chǎn)業(yè)高質(zhì)量發(fā)展

12-19

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

12-19

榮耀MagicOS 9.0升級全解析：新功能適配進(jìn)度與長焦拍照優(yōu)化進(jìn)行時

12-19

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

12-19

閃極AI拍拍鏡震撼上市！國內(nèi)首款量產(chǎn)，售價僅999元起

12-19

蘋果中國AI大模型合作引關(guān)注，字節(jié)騰訊誰將脫穎而出？

值得一題的是，12月19日，北京智源人工智能研究院（智院研究員）發(fā)布國內(nèi)外100余個開源和商業(yè)閉源模型多份評測結(jié)果，作為今年英偉達(dá)全球第二大買家、擁有23萬張GPU的字節(jié)跳動豆包大模型名列前茅，語言模型結(jié)果…

12-19

張一鳴私募新動作，重心已悄然轉(zhuǎn)向大模型與AI戰(zhàn)略？

12-19

算力硬件引領(lǐng)市場熱潮，豆包概念股能否持續(xù)走強？

12-19

市場分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

12-19

北證50深V反轉(zhuǎn)，AI硬件與微信小店成市場新寵？

12-19

OpenAI Canvas大升級：React渲染與文本格式化新工具來襲

12-19

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機座機也能聊

12-19

AMD蘇姿豐領(lǐng)投，Liquid AI崛起：機器人之母帶隊，AI賽道再掀狂瀾

12-19

點擊查看更多 +

全站最新

“王妃”炫富帶貨后集體消失，網(wǎng)友直呼：別再消耗我們的善良！

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

打假人王海遭品牌起訴，道歉后又要反訴，這場“打假”戰(zhàn)何時休？

余承東透露：鴻蒙智行受車廠熱捧，資源有限難以滿足所有合作需求

余承東回憶：與北汽合作始于2017年一張PPT開啟華為汽車夢

榮耀Magic7 RSR保時捷設(shè)計：100倍AI長焦，樣張細(xì)節(jié)震撼曝光！

熱門內(nèi)容

本欄最新

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

天陽科技與SS&C攜手，億元打造Algorithmics軟件獨家信創(chuàng)版

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費產(chǎn)業(yè)高質(zhì)量發(fā)展

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

榮耀MagicOS 9.0升級全解析：新功能適配進(jìn)度與長焦拍照優(yōu)化進(jìn)行時

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

圖森未來發(fā)布Ruyi視頻大模型，消費級顯卡即可運行

圖森未來發(fā)布Ruyi視頻大模型，消費級顯卡即可運行