滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

AI視頻生成技術(shù)研討會：破解生成式AI領域新挑戰(zhàn)

時間：2024-11-25 20:08:30 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

2024年，備受矚目的中國生成式AI大會（上海站）「GenAICon 2024」將于12月5日至6日在上海中星鉑爾曼大酒店隆重舉行。作為國內(nèi)生成式AI領域最具影響力的產(chǎn)業(yè)峰會之一，此次大會不僅標志著該盛會首次登陸上海，更由智一科技旗下的智能產(chǎn)業(yè)媒體智東西與AI及硬科技知識分享平臺智猩猩共同發(fā)起，上海市人工智能行業(yè)協(xié)會擔任指導單位。

大會以“智能躍進創(chuàng)造無限”為主題，精心設計了“主會場峰會+分會場研討會+展覽區(qū)”的多元化架構(gòu)。主會場將聚焦大模型峰會與AI Infra峰會，而分會場則安排了端側(cè)生成式AI、AI視頻生成以及具身智能三場技術(shù)研討會，輔以豐富的展覽區(qū)，為參會者提供全方位的交流與學習平臺。

超過50位行業(yè)領袖與專家將匯聚一堂，通過致辭、演講、報告及對話討論等形式，以前瞻視角深入探討生成式AI的技術(shù)創(chuàng)新、商業(yè)應用、未來趨勢及前沿研究焦點。在大會的眾多精彩環(huán)節(jié)中，AI視頻生成技術(shù)研討會作為分會場的重要組成部分，備受期待。

AI視頻生成技術(shù)研討會定于第二日上午舉行，涵蓋主題報告與圓桌Panel兩大環(huán)節(jié)。自年初Sora問世以來，AI視頻生成領域風起云涌，國內(nèi)外眾多參與者競相角逐。然而，該領域仍面臨諸多亟待解決的關(guān)鍵問題，學術(shù)界與工業(yè)界正共同努力，以期實現(xiàn)技術(shù)突破，提升視頻生成大模型及應用產(chǎn)品的用戶體驗。

此次研討會邀請了五位杰出的青年學者和技術(shù)專家，包括中存算董事長陳巍、上海交通大學人工智能研究院助理教授晏軼超、新壹科技AI算法主任架構(gòu)師李璋、井英科技聯(lián)合創(chuàng)始人兼CTO王健以及曠視研究院高級研究員李華東。他們將圍繞視頻大模型架構(gòu)比較、三維數(shù)字人視頻生成、面向數(shù)字人生成的視頻垂直大模型、AI短劇技術(shù)突破以及可控人物視頻生成等前沿話題展開深入講解。

陳巍博士將對比主流視頻生成大模型架構(gòu)，探討內(nèi)存墻和通信墻對視頻大模型訓練的挑戰(zhàn)，并分享算力芯片級訓練部署的解決方案。晏軼超教授將介紹三維數(shù)字人視頻生成的最新進展，探討發(fā)展趨勢。李璋將分享新壹視頻大模型在數(shù)字人視頻生成中的核心技術(shù)突破，展示典型應用案例。王健將分享井英科技在AI短劇制作中的關(guān)鍵技術(shù)突破，探討商業(yè)模式。李華東則將介紹支持混合模態(tài)控制的人像視頻生成算法MegActor系列工作。

陳巍博士在《視頻大模型架構(gòu)對比及長序列模型加速》的報告中指出，視頻大模型與短視頻產(chǎn)業(yè)的結(jié)合正迎來新的爆發(fā)機遇，他深入探討了視頻生成大模型的關(guān)鍵技術(shù)及其面臨的挑戰(zhàn)，分享了針對視頻長序列模型算力芯片級訓練部署的解決方案與系統(tǒng)經(jīng)驗。

晏軼超教授在《先驗引導的三維數(shù)字人視頻生成》的報告中，從數(shù)字人重建、生成與編輯等方向介紹了數(shù)字人視頻生成領域的最新進展，并對三維數(shù)字人技術(shù)的發(fā)展趨勢進行了展望。

李璋在《視頻垂直大模型在智能數(shù)字人生成中的應用》的報告中，闡述了從通用大模型到垂直大模型的演進，介紹了新壹視頻大模型在數(shù)字人視頻生成中的核心技術(shù)突破，深入分析了自然語言驅(qū)動的動作與表情生成技術(shù)，并展示了相關(guān)領域的典型應用案例。

王健在《AI短劇拐點背后的技術(shù)突破》的報告中，分享了井英科技通過視頻生成模型實現(xiàn)100分鐘以上短視頻制作的經(jīng)驗，探討了AI短劇從不可行到可行的關(guān)鍵技術(shù)突破，并展望了未來的商業(yè)模式。

李華東在《可控人物視頻生成》的報告中，介紹了MegActor系列工作，這是一種支持混合模態(tài)控制的人像視頻生成算法，能夠?qū)崿F(xiàn)角色自定義，通過視頻、音頻和文本輸入實現(xiàn)單獨和混合控制，為高質(zhì)量視頻內(nèi)容的生成提供了新的解決方案。

在圓桌Panel環(huán)節(jié)，陳巍、晏軼超、王健和李華東將圍繞AI視頻生成領域的熱點話題展開深入討論，為參會者帶來更多啟發(fā)與思考。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

GPT-5研發(fā)受阻，OpenAI巨額投入能否換回預期回報？

12-22

億滋公司用AI研發(fā)新口味零食，奧利奧、趣多多將迎新變化？

12-22

AI編程助手Cursor融資破億，估值暴漲至26億美元引熱議

12-22

港中大研發(fā)眼科AI模型，診斷能力媲美甚至超越中級眼科醫(yī)生

12-22

小米澎湃OS 2新進展：MIX Flip等機型推送時間公布

12-22

OpenAI聯(lián)創(chuàng)爆料：馬斯克被指“惡霸”，與多位科技大佬交惡

三言科技12月22日消息，據(jù)報道，OpenAI聯(lián)合創(chuàng)始人薩姆·奧特曼形容埃隆·馬斯克為“惡霸”，稱馬斯克與許多億萬富翁都發(fā)生過口角，包括杰夫·貝索斯、比爾·蓋茨以及馬克·扎克伯格等人。此前，馬斯克多次對Op…

12-22

蘋果2025年或推新HomePod：配7英寸屏A18芯片，天馬微電子供應面板

三言科技12月22日消息，據(jù)報道，蘋果計劃于2025年推出全新“HomePod”設備，該設備將配備7英寸LCD顯示屏，搭載A18芯片，并且支持蘋果人工智能。不過，該HomePod售價尚不清楚，報道稱蘋果已選…

12-22

蘋果iOS 18.2.1小版本更新測試中，年底或迎新升級？

12-22

蘋果iOS 19系統(tǒng)曝光：iPhone XS/XR等老機型能否再獲一年支持？

12-22

蘋果2025年將推7英寸屏HomePod，搭載A18芯片，智能家居新體驗？

12-22

小紅書商業(yè)化新路徑：深耕搜索，能否打破電商化瓶頸？

不只是小紅書，鈦媒體APP觀察到，包括B站、騰訊廣告在內(nèi)的平臺，都在朝這一方向發(fā)力，都在給廣告主們強調(diào)一個概念——內(nèi)容的“外溢價值”，即廣告投放在所投放平臺之外產(chǎn)生的轉(zhuǎn)化價值。她觀察到，是用戶對某件商品或者…

12-21

折疊屏2024：新選擇、好幫手，還有哪些待解之題？

隨著產(chǎn)品各項能力的全面成熟，折疊屏已經(jīng)進化成為一個全新的消費電子產(chǎn)品，正如一位手機從業(yè)者所說，“過去五年，折疊屏已經(jīng)把厚度、重量、可靠性這些問題都已經(jīng)解決了，消費者可以不用去關(guān)注了”。我們注意到，OPPO …

12-21

名創(chuàng)優(yōu)品：興趣消費領航者，中國品牌全球化新路徑

12-21

飛天云動領航元宇宙文旅，攜重慶兩江共創(chuàng)數(shù)字新篇章

12-21

華為亮劍金融云核心，主機上云方案引領金融科技新未來

12-21

點擊查看更多 +

全站最新

東風風行星海S7長續(xù)航版來襲，蘭博基尼同款懸掛，售14.99萬起！

高通Oryon CPU官司大勝，未來年省14億美元專利費

理想超充站試水超時收費：15分鐘外每分鐘2元，上限200元！

英特爾B580顯卡：補齊短板，性價比出眾，未來可期？

GPT-5研發(fā)受阻，OpenAI巨額投入能否換回預期回報？

億滋公司用AI研發(fā)新口味零食，奧利奧、趣多多將迎新變化？

熱門內(nèi)容

本欄最新

GPT-5研發(fā)受阻，OpenAI巨額投入能否換回預期回報？

億滋公司用AI研發(fā)新口味零食，奧利奧、趣多多將迎新變化？

AI編程助手Cursor融資破億，估值暴漲至26億美元引熱議

港中大研發(fā)眼科AI模型，診斷能力媲美甚至超越中級眼科醫(yī)生

蘋果iOS 18.2.1小版本更新測試中，年底或迎新升級？

蘋果iOS 19系統(tǒng)曝光：iPhone XS/XR等老機型能否再獲一年支持？

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.