滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

阿里新專利：圖生視頻技術(shù)，智能化端到端生成無需預(yù)設(shè)運動參數(shù)

時間：2025-02-07 17:09:50 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近日，阿里巴巴（中國）有限公司在視頻生成技術(shù)領(lǐng)域取得了新進展，一項名為“一種圖生視頻方法和裝置”的專利被正式公布。據(jù)天眼查知識產(chǎn)權(quán)信息顯示，這項專利的公布標志著阿里巴巴在智能化視頻生成方面邁出了重要一步。

該專利的核心在于，通過一種創(chuàng)新的實施例，實現(xiàn)了從靜態(tài)圖像到動態(tài)視頻的智能化轉(zhuǎn)換。具體而言，該方法首先將包含目標對象的源圖像輸入到一個精心設(shè)計的第一視頻生成模型中，從而生成一個基礎(chǔ)的素材視頻。接下來，根據(jù)這個素材視頻，系統(tǒng)會自動確定一個幀間變換矩陣序列，這個序列用于描述視頻中幀與幀之間的變換關(guān)系。

在獲取了幀間變換矩陣序列后，系統(tǒng)會進一步從源圖像中提取出目標對象對應(yīng)的對象掩碼圖像。這個掩碼圖像相當于一個“模板”，用于在后續(xù)步驟中準確地識別和提取目標對象。隨后，將幀間變換矩陣序列應(yīng)用于這個對象掩碼圖像，生成一系列掩碼圖像，組成掩碼圖像序列。同時，將幀間變換矩陣序列也應(yīng)用于源圖像，生成一系列目標對象圖像，組成目標對象圖像序列。

有了這些基礎(chǔ)數(shù)據(jù)后，系統(tǒng)會根據(jù)源圖像、掩碼圖像序列和目標對象圖像序列，確定一個目標輸入數(shù)據(jù)。這個數(shù)據(jù)被輸入到一個支持局部重繪的第二視頻生成模型中。這個模型能夠利用前面的數(shù)據(jù)，生成一個與目標對象高度匹配、且運動軌跡多樣的目標視頻。

這種方法實現(xiàn)了智能化端到端的圖生視頻生成，無需預(yù)先設(shè)定運動參數(shù)。這意味著，系統(tǒng)能夠自動地根據(jù)源圖像中的目標對象，生成具有豐富運動軌跡的視頻，同時保持目標對象在視頻中的清晰度和連貫性，避免了目標對象的擴散問題。

阿里巴巴的這項專利，無疑為視頻生成技術(shù)帶來了新的突破。隨著智能化技術(shù)的不斷發(fā)展，這種圖生視頻方法將在各個領(lǐng)域發(fā)揮越來越重要的作用，為人們的生活和工作帶來更多便利和樂趣。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

沃爾瑪中國被曝欠稅1125萬，稅務(wù)機關(guān)已公告

02-07

美團佛山新設(shè)科技公司，涉足日用品及外賣遞送服務(wù)

02-07

尼康Z5 II相機預(yù)計2025夏發(fā)布，Expeed 7處理器成升級亮點

02-07

MCU大廠Microchip營收持續(xù)下滑，庫存修正周期何時是個頭？

02-07

英特爾2024財報黯淡，裁員潮未止，一年已減員2.3萬

02-07

南極秦嶺站周年慶典，綠色能源系統(tǒng)即將啟用，極地科考邁入新階段！

02-07

格羅方德CEO更迭，前掌門或投身英特爾引猜想

02-07

春節(jié)旅游“開門紅”！企查查：去年旅游企業(yè)注冊量超30萬家

企業(yè)存量方面，我國現(xiàn)存220.4萬家旅游相關(guān)企業(yè)，其中成立年限在5-10年的企業(yè)最多，占比超三成。成立年限上，我國成立5-10年的旅游相關(guān)企業(yè)最多，占比31.6%，其次是成立1-3年的企業(yè)，占比24.4%，成…

02-07

趙永剛?cè)翁窖笕藟郾ｋU公司董事長完成工商變更

企查查信息顯示，該公司成立于2001年11月，法定代表人為李勁松，注冊資本約86.28億人民幣，由中國太保（601601）、申能（集團）有限公司等共同持股。據(jù)此前報道，中國太平洋人壽保險股份有限公司2024…

02-07

DeepSeek確定加盟2025全球開發(fā)者先鋒大會，共襄盛舉

從2月7日在上海徐匯召開的全球開發(fā)者先鋒大會新聞發(fā)布會上獲悉，對于2月21日至23日將在上海徐匯開幕的2025全球開發(fā)者先鋒大會，大會組委會已和深度求索（DeepSeek）公司團隊取得聯(lián)系，DeepSeek將…

02-07

美團布局佛山新領(lǐng)域，歪馬科技悄然成立涉多業(yè)務(wù)范疇

三言科技 2月7日消息，天眼查App顯示，近日，佛山歪馬科技有限公司成立，法定代表人為羅利寧，注冊資本100萬人民幣，經(jīng)營范圍含日用品銷售、五金產(chǎn)品零售、寵物食品及用品零售、互聯(lián)網(wǎng)銷售、外賣遞送服務(wù)、食品互聯(lián)…

02-07

極越最新回應(yīng)：61名用戶購車款已退，充電樁安裝有序進行中

三言科技2月7日消息，極越今日發(fā)布《極越關(guān)于用戶關(guān)心的問題說明（第八次）》，針對用戶定金退款進度和充電樁安裝進度進行了說明。由于在退款過程每一筆款項的信息收集、審核、確認以及打款操作都需要人工完成，這一過程需…

02-07

春節(jié)旅游火爆開局！2024年旅游企業(yè)注冊量突破30萬大關(guān)

02-07

一元成交！這家公司80%股權(quán)拍賣背后有何隱情？

02-07

趙永剛正式接棒！太平洋人壽保險公司董事長人選塵埃落定

02-07

點擊查看更多 +

全站最新

蘋果臺燈機器人：非人形也能高情商，點頭哈腰展現(xiàn)細膩情感

美團布局佛山新領(lǐng)域，歪馬科技悄然成立涉多業(yè)務(wù)范疇

歐洲豪車在華能否打響“翻身仗”？

沃爾沃全球業(yè)績亮眼，為何在中國市場卻連年下滑？

新款大眾ID.3情人節(jié)上市，磷酸鐵鋰電池版能否續(xù)寫熱銷傳奇？

特斯拉新充電福利：家充樁超值或超充1元/度，Model 3入手更劃算！

熱門內(nèi)容

本欄最新

尼康Z5 II相機預(yù)計2025夏發(fā)布，Expeed 7處理器成升級亮點

MCU大廠Microchip營收持續(xù)下滑，庫存修正周期何時是個頭？

英特爾2024財報黯淡，裁員潮未止，一年已減員2.3萬

南極秦嶺站周年慶典，綠色能源系統(tǒng)即將啟用，極地科考邁入新階段！

格羅方德CEO更迭，前掌門或投身英特爾引猜想

春節(jié)旅游“開門紅”！企查查：去年旅游企業(yè)注冊量超30萬家

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

阿里新專利：圖生視頻技術(shù)，智能化端到端生成無需預(yù)設(shè)運動參數(shù)

阿里新專利：圖生視頻技術(shù)，智能化端到端生成無需預(yù)設(shè)運動參數(shù)