滾動資訊

當(dāng)前位置：首頁 > 資訊 > 手機(jī)快報(bào) > 正文內(nèi)容

新一代視覺語言模型來襲！阿里通義千問支持20分鐘長視頻創(chuàng)作，顛覆你的想象！

時(shí)間：2024-09-02 20:26:18 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

【ITBEAR】9月2日消息，近日，阿里云通義千問宣布推出全新升級的第二代視覺語言模型Qwen2-VL，該模型在視覺和語言理解能力上實(shí)現(xiàn)了質(zhì)的飛躍。

與上一代相比，Qwen2-VL展現(xiàn)出了更為出色的性能。它不僅能夠輕松解讀各種分辨率和尺寸的圖片，更在多項(xiàng)基準(zhǔn)測試中，包括DocVQA、RealWorldQA和MTVQA，取得了令人矚目的全球領(lǐng)先成績。值得一提的是，該模型還具備了對長視頻內(nèi)容的深度理解能力，可以處理超過20分鐘的視頻，并支持基于視頻的問答、對話以及內(nèi)容創(chuàng)作等多種應(yīng)用場景。

據(jù)ITBEAR了解，Qwen2-VL此次推出了2B和7B兩種尺寸的模型，同時(shí)還提供了量化版本以供選擇。此外，旗艦級的Qwen2-VL-72B模型也已通過API形式在阿里云百煉平臺上開放，供用戶直接調(diào)用，大大提升了使用的便捷性。

在功能方面，Qwen2-VL還展現(xiàn)了強(qiáng)大的視覺智能體實(shí)力。它能夠自主操作手機(jī)和機(jī)器人，根據(jù)所處的視覺環(huán)境和文字指令進(jìn)行智能化的自動操作，這一功能的加入無疑將極大地拓展模型的應(yīng)用范圍。

值得一提的是，Qwen2-VL還具備多語言文本理解能力，可以處理包括中文、英文、多數(shù)歐洲語言、日語、韓語、阿拉伯語以及越南語等在內(nèi)的多種語言。這一特性將極大地提升其在國際市場中的競爭力。

在技術(shù)層面，Qwen2-VL延續(xù)了ViT加Qwen2的經(jīng)典串聯(lián)結(jié)構(gòu)，并在此基礎(chǔ)上進(jìn)行了多項(xiàng)創(chuàng)新。所有尺寸的模型都采用了統(tǒng)一的600M規(guī)模ViT，這使得模型能夠同時(shí)支持圖像和視頻的輸入。為了進(jìn)一步提升模型的感知和理解能力，團(tuán)隊(duì)還實(shí)現(xiàn)了對原生動態(tài)分辨率的全面支持，并引入了創(chuàng)新的多模態(tài)旋轉(zhuǎn)位置嵌入（M-ROPE）方法。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

榮耀Magic7 RSR保時(shí)捷設(shè)計(jì)：100倍AI長焦，樣張細(xì)節(jié)震撼曝光！

12-19

蘋果iOS 18.1.1關(guān)閉降級通道，用戶需擁抱iOS 18.2新功能

12-19

AI芯片新賽道：博通成“反英偉達(dá)”聯(lián)盟熱門選擇

12-19

OPPO Find N5年后將發(fā)布，首批驍龍8至尊版折疊屏手機(jī)來襲？

12-19

微信新功能頻出，張軍呼吁別給過高評價(jià)，你體驗(yàn)了嗎？

12-19

愛瑪A7 Plus旗艦新品上市，主打年輕男性市場，智能化生產(chǎn)引領(lǐng)未來

12-19

年底銀行指標(biāo)大戰(zhàn)：全家總動員，銀行人如何突圍？

小劉坦言自己在閑魚買過存款中介的相關(guān)服務(wù)，年底來了，存款業(yè)績還沒完成，如果完不成，輕則被領(lǐng)導(dǎo)叫去喝茶，重則扣工資。很多銀行客戶經(jīng)理也沒搞清保險(xiǎn)的各種知識點(diǎn)，因?yàn)橐瓿傻闹匾笜?biāo)很多，而銀行不是專業(yè)賣保險(xiǎn)的機(jī)…

12-19

快輪科技新品閃耀長江商學(xué)院，共探數(shù)智經(jīng)濟(jì)創(chuàng)新之路

12-19

蘋果Meta互操作爭端白熱化，歐盟調(diào)查結(jié)果能否平息戰(zhàn)火？

12-19

vivo X200系列海外上市，天璣9400加持，頂配售價(jià)破八千元大關(guān)

12-19

realme 14 Pro 亮相：全球首款冷敏變色手機(jī)，外觀設(shè)計(jì)獨(dú)特驚艷

12-19

微信新功能上線，張軍：別再用“史詩級”形容我們了！

12-19

盒馬同仁堂聯(lián)手，藥食同源新品破解健康飲食難題！

盒馬即食部總經(jīng)理寧強(qiáng)表示，藥食同源正在成為消費(fèi)市場的新趨勢，越來越多的消費(fèi)者也開始把養(yǎng)生融入到自己的日常生活中，盒馬研發(fā)商品的邏輯，就是要在保證配料表干凈的基礎(chǔ)上，把適合做成日常飲食的食補(bǔ)配方做得更好吃，更…

12-19

蘋果放棄按月租用iPhone計(jì)劃，硬件訂閱服務(wù)終成泡影

12-19

OPPO A5 Pro滿級防水新升級，能否真的應(yīng)對十八種水源挑戰(zhàn)？

12-19

點(diǎn)擊查看更多 +

全站最新

“王妃”炫富帶貨后集體消失，網(wǎng)友直呼：別再消耗我們的善良！

蘋果AI尋中國“盟友”，騰訊字節(jié)誰能“入果”？iPhone創(chuàng)新何在？

打假人王海遭品牌起訴，道歉后又要反訴，這場“打假”戰(zhàn)何時(shí)休？

余承東透露：鴻蒙智行受車廠熱捧，資源有限難以滿足所有合作需求

余承東回憶：與北汽合作始于2017年一張PPT開啟華為汽車夢

榮耀Magic7 RSR保時(shí)捷設(shè)計(jì)：100倍AI長焦，樣張細(xì)節(jié)震撼曝光！

熱門內(nèi)容

本欄最新

榮耀Magic7 RSR保時(shí)捷設(shè)計(jì)：100倍AI長焦，樣張細(xì)節(jié)震撼曝光！

蘋果iOS 18.1.1關(guān)閉降級通道，用戶需擁抱iOS 18.2新功能

AI芯片新賽道：博通成“反英偉達(dá)”聯(lián)盟熱門選擇

OPPO Find N5年后將發(fā)布，首批驍龍8至尊版折疊屏手機(jī)來襲？

微信新功能頻出，張軍呼吁別給過高評價(jià)，你體驗(yàn)了嗎？

年底銀行指標(biāo)大戰(zhàn)：全家總動員，銀行人如何突圍？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

新一代視覺語言模型來襲！阿里通義千問支持20分鐘長視頻創(chuàng)作，顛覆你的想象！

新一代視覺語言模型來襲！阿里通義千問支持20分鐘長視頻創(chuàng)作，顛覆你的想象！