ITBear旗下自媒體矩陣：

滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

OpenAI發(fā)布Sora文生視頻大模型，清華大學(xué)亦有新專利公布

時(shí)間：2024-02-21 08:52:36 來源：ITBEAR編輯：瑞雪 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR科技資訊】2月21日消息，近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI發(fā)布了其首款名為Sora的文本生成視頻大模型。這款模型能夠根據(jù)用戶提供的文字提示，生成長(zhǎng)達(dá)60秒的高質(zhì)量視頻。令人驚嘆的是，Sora所輸出的視頻效果堪比專業(yè)的影視CG，因此在發(fā)布后迅速引爆了科技圈。

與此同時(shí)，在文生視頻技術(shù)的研發(fā)上，國(guó)內(nèi)高校也取得了顯著進(jìn)展。據(jù)國(guó)家知識(shí)產(chǎn)權(quán)局網(wǎng)站公布的信息，清華大學(xué)于2月2日申請(qǐng)了一項(xiàng)名為“一種定制化多主體文生視頻方法、裝置、設(shè)備及介質(zhì)”的專利。該專利涉及神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域，為文生視頻技術(shù)的進(jìn)一步發(fā)展提供了新的思路。

據(jù)ITBEAR科技資訊了解，清華大學(xué)的這項(xiàng)專利申請(qǐng)中詳細(xì)描述了一種定制化多主體文生視頻的方法。該方法需要獲取多個(gè)主體分別對(duì)應(yīng)的主體文本表述以及主體圖像;然后，基于這些信息，進(jìn)一步獲取混合文本和組合圖像。接下來，將混合文本和組合圖像輸入到文生視頻模型中，生成第二噪聲預(yù)測(cè)值，并根據(jù)這個(gè)預(yù)測(cè)值與組合圖像，計(jì)算出第二損失和第三損失。通過綜合考慮第一損失、第二損失與第三損失，對(duì)文生視頻模型進(jìn)行優(yōu)化，從而得到一個(gè)性能更優(yōu)的文生視頻模型。

這項(xiàng)專利技術(shù)的創(chuàng)新之處在于，它通過多種損失函數(shù)對(duì)文生視頻模型的參數(shù)進(jìn)行優(yōu)化，確保在基于文本描述生成視頻中的圖像時(shí)，文本描述與定制化主體能夠保持一致。同時(shí)，該技術(shù)在生成過程中能夠確保每個(gè)主體的特征不會(huì)發(fā)生混淆，并且在最終的視頻中消除合成痕跡，從而提升視頻的整體質(zhì)量和觀感。

標(biāo)簽： Sora

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

馬斯克再陷訴訟風(fēng)波，對(duì)陣OpenAI勝算幾何？

鞭牛士報(bào)道，10月13日消息，據(jù)《財(cái)富》報(bào)道，埃隆·馬斯克贏得針對(duì) OpenAI 的第二起訴訟的機(jī)會(huì)看起來很渺茫。馬斯克試圖迫使他之前創(chuàng)立的組織向他支付他在五年內(nèi)捐贈(zèng)的 4460 萬(wàn)美元的三倍，并開源其神經(jīng)…

10-13

馬斯克再陷訴訟風(fēng)波，對(duì)陣OpenAI勝算幾何？

鞭牛士報(bào)道，10月13日消息，據(jù)《財(cái)富》報(bào)道，埃隆·馬斯克贏得針對(duì) OpenAI 的第二起訴訟的機(jī)會(huì)看起來很渺茫。馬斯克試圖迫使他之前創(chuàng)立的組織向他支付他在五年內(nèi)捐贈(zèng)的 4460 萬(wàn)美元的三倍，并開源其神經(jīng)…

10-13

OpenAI前CTO米拉·穆拉蒂：AI界最具影響力女性？

此外，我們還將深入了解她的傳記、教育和職業(yè)成就，以彰顯她在科技界的專業(yè)知識(shí)和權(quán)威。隨著人工智能技術(shù)的發(fā)展，Mira Murati 有望走在這些發(fā)展的前沿，塑造人工智能與醫(yī)療保健、金融和教育等各個(gè)領(lǐng)域互動(dòng)的未…

10-13

CeriBell醫(yī)療診斷系統(tǒng)上市，首日大漲47%，募資1.8億！

截至2024年9月30日，CeriBell持有的現(xiàn)金及現(xiàn)金等價(jià)物為1410萬(wàn)美元。 Red Tree VentureFund持股為6.7%，Optimas Capital Partners Fund LP…

10-13

GLM-4-Plus賦能“閱讀智能體”，效率飆升300%？

在智譜的Demo中，輸入長(zhǎng)達(dá)40秒的視頻后，GLM-4-Plus可以準(zhǔn)確理解并感知時(shí)間，精準(zhǔn)定位到事件發(fā)生的時(shí)刻，然后在視頻理解的基礎(chǔ)上結(jié)合上下文進(jìn)行對(duì)話，比如視頻中的某個(gè)物體是在第幾秒出現(xiàn)的、一共出現(xiàn)了幾…

10-13

AI領(lǐng)軍者摘諾獎(jiǎng)，產(chǎn)業(yè)AI變革時(shí)代真的來了？

簡(jiǎn)而言之，Hopfield網(wǎng)絡(luò)和Hinton的工作都是將物理學(xué)的概念應(yīng)用于神經(jīng)網(wǎng)絡(luò)，以模擬大腦的工作方式，讓計(jì)算機(jī)能夠?qū)W習(xí)、記憶和識(shí)別復(fù)雜的數(shù)據(jù)模式。更重要的是，Hopfield、Hinton展示了物理…

10-13

任澤平、但斌隔空互撕，李大霄欲當(dāng)和事佬，誰(shuí)將更勝一籌？

在10月6日，但斌發(fā)布微博提醒投資者理性看待A股上漲，并表示其只看反彈不看牛市。對(duì)于上述爭(zhēng)論，前券商首席經(jīng)濟(jì)學(xué)家李大霄在接受北京商報(bào)記者采訪時(shí)表示：“兩人對(duì)行情有爭(zhēng)論可以理解，一個(gè)認(rèn)為是‘大牛市’，一個(gè)認(rèn)為…

10-13

歌爾集團(tuán)攜手上海浦東新區(qū)，共創(chuàng)國(guó)際創(chuàng)新中心！

10 月 13 日消息，據(jù)“浦東發(fā)布”官方公眾號(hào)，10 月 12 日下午，浦東新區(qū)與歌爾集團(tuán)戰(zhàn)略合作協(xié)議簽約儀式在新區(qū)辦公中心舉行?！?注：“浦東發(fā)布”公眾號(hào)截圖根據(jù)戰(zhàn)略合作協(xié)議，歌爾…

10-13

蘋果新研究：LLM大模型有缺陷？未實(shí)現(xiàn)真正邏輯推理！

盡管這些模型在生成人類水平的文本方面表現(xiàn)出色，但當(dāng)處理簡(jiǎn)單的數(shù)學(xué)問題時(shí)，即使問題僅進(jìn)行了微小的改動(dòng)，如添加無(wú)關(guān)信息，模型的表現(xiàn)也會(huì)急劇下降。在論文中，研究人員通過一個(gè)簡(jiǎn)單的數(shù)學(xué)問題證明了這一點(diǎn)。但是，一…

10-13

微軟豪擲千億布局AI，OpenAI只是冰山一角？

除OpenAI外，微軟陸續(xù)與全球各地的AI明星企業(yè)建立鏈接，在不到兩年的時(shí)間里，用資本拼出了一幅遍布全球的AI版圖。 5月2日，納德拉在曼谷做出“重大承諾”，稱微軟將在泰國(guó)建設(shè)新的云計(jì)算和AI基礎(chǔ)設(shè)施，為超過…

10-13

科大訊飛本周下跌3.44%，軟件開發(fā)板塊微跌0.02%，咋回事？

10月7日晚間，中創(chuàng)環(huán)保公告，公司擬以6.44元/股的價(jià)格向邢臺(tái)瀟帆科技有限公司（以下簡(jiǎn)稱“瀟帆科技”），發(fā)行股票不超過7763.98萬(wàn)股，募資不超過5億元。根據(jù)公告，中創(chuàng)環(huán)保擬向邢臺(tái)瀟帆發(fā)行不超過7763…

10-13

生成式AI大模型火了？注冊(cè)用戶已超6億！

2024-10-13 09:47:58 作者：姚立偉我國(guó)生成式人工智能服務(wù)大模型注冊(cè)用戶突破6億央視新聞報(bào)道，工業(yè)和信息化部總工程師趙志國(guó)昨日表示，我國(guó)人工智能核心產(chǎn)業(yè)規(guī)模在不斷提升，企業(yè)數(shù)量超過450…

10-13

蘋果再出手，300億參數(shù)AI大模型MM1.5來了！

此外，研究人員在監(jiān)督式微調(diào)階段分析了不同數(shù)據(jù)類型對(duì)模型表現(xiàn)的影響，優(yōu)化了視覺指令微調(diào)數(shù)據(jù)的混合方式，從而為模型實(shí)現(xiàn)了更高的效率，團(tuán)隊(duì)表示，即便是小規(guī)模的模型（10、30億參數(shù)版本）也能表現(xiàn)出色。值得關(guān)注…

10-13

AI醫(yī)療建議靠譜嗎？22%的回答可能致命！

快科技10月13日消息，最新的研究結(jié)果表明，AI在提供醫(yī)療建議時(shí)存在比較大的安全隱患。德國(guó)和比利時(shí)的研究人員對(duì)微軟的Bing Copilot進(jìn)行了測(cè)試，該引擎能夠回答美國(guó)最常見的10個(gè)醫(yī)療問題以及50種最?！?/div>

10-13

蘋果新突破！300億參數(shù)AI大模型MM1.5，能識(shí)圖懂語(yǔ)

其中，MM1.5-UI模型未來有望成為iOS背后的“蘋果牌”AI，能夠處理各種視覺引用與定位任務(wù)，還能總結(jié)屏幕上的功能，或者通過與用戶的對(duì)話進(jìn)行交互。盡管MM1.5模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，但蘋果團(tuán)隊(duì)…

10-13

點(diǎn)擊查看更多 +

全站最新

天璣9400 GPU實(shí)測(cè)：滿幀運(yùn)行，冰涼手感，能效霸主？

天璣9400 GPU實(shí)測(cè)：滿幀運(yùn)行，冰涼手感，能效霸主？

馬斯克星艦第五次試飛，今日上演，“筷子夾火箭”成真？

馬斯克星艦第五次試飛，今日上演，“筷子夾火箭”成真？

天璣9400實(shí)測(cè)：CPU、GPU性能猛增，旗艦新標(biāo)桿？

天璣9400實(shí)測(cè)：CPU、GPU性能猛增，旗艦新標(biāo)桿？

馬斯克“星艦”飛船可控濺落入海，這操作你怎么看？

馬斯克“星艦”飛船可控濺落入海，這操作你怎么看？

馬斯克也頭疼？Robotaxi這題，到底怎么解？

馬斯克也頭疼？Robotaxi這題，到底怎么解？

嵐圖知音上市，19.69萬(wàn)起售，續(xù)航900+km，能終結(jié)Model Y嗎？

嵐圖知音上市，19.69萬(wàn)起售，續(xù)航900+km，能終結(jié)Model Y嗎？

熱門內(nèi)容

本欄最新

CeriBell醫(yī)療診斷系統(tǒng)上市，首日大漲47%，募資1.8億！

CeriBell醫(yī)療診斷系統(tǒng)上市，首日大漲47%，募資1.8億！

GLM-4-Plus賦能“閱讀智能體”，效率飆升300%？

GLM-4-Plus賦能“閱讀智能體”，效率飆升300%？

AI領(lǐng)軍者摘諾獎(jiǎng)，產(chǎn)業(yè)AI變革時(shí)代真的來了？

AI領(lǐng)軍者摘諾獎(jiǎng)，產(chǎn)業(yè)AI變革時(shí)代真的來了？

任澤平、但斌隔空互撕，李大霄欲當(dāng)和事佬，誰(shuí)將更勝一籌？

任澤平、但斌隔空互撕，李大霄欲當(dāng)和事佬，誰(shuí)將更勝一籌？

歌爾集團(tuán)攜手上海浦東新區(qū)，共創(chuàng)國(guó)際創(chuàng)新中心！

歌爾集團(tuán)攜手上海浦東新區(qū)，共創(chuàng)國(guó)際創(chuàng)新中心！

蘋果新研究：LLM大模型有缺陷？未實(shí)現(xiàn)真正邏輯推理！

蘋果新研究：LLM大模型有缺陷？未實(shí)現(xiàn)真正邏輯推理！

網(wǎng)站首頁(yè) | 關(guān)于我們 | 聯(lián)系方式 | 版權(quán)聲明 | 網(wǎng)站留言 | RSS訂閱 | 違規(guī)舉報(bào) | 開放轉(zhuǎn)載 | 滾動(dòng)資訊 | English Version

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

<tt id="vtcfh"></tt>