2024年,備受矚目的中國生成式AI大會(上海站)「GenAICon 2024」將于12月5日至6日在上海中星鉑爾曼大酒店隆重舉行。作為國內(nèi)生成式AI領域最具影響力的產(chǎn)業(yè)峰會之一,此次大會不僅標志著該盛會首次登陸上海,更由智一科技旗下的智能產(chǎn)業(yè)媒體智東西與AI及硬科技知識分享平臺智猩猩共同發(fā)起,上海市人工智能行業(yè)協(xié)會擔任指導單位。
大會以“智能躍進 創(chuàng)造無限”為主題,精心設計了“主會場峰會+分會場研討會+展覽區(qū)”的多元化架構(gòu)。主會場將聚焦大模型峰會與AI Infra峰會,而分會場則安排了端側(cè)生成式AI、AI視頻生成以及具身智能三場技術(shù)研討會,輔以豐富的展覽區(qū),為參會者提供全方位的交流與學習平臺。
超過50位行業(yè)領袖與專家將匯聚一堂,通過致辭、演講、報告及對話討論等形式,以前瞻視角深入探討生成式AI的技術(shù)創(chuàng)新、商業(yè)應用、未來趨勢及前沿研究焦點。在大會的眾多精彩環(huán)節(jié)中,AI視頻生成技術(shù)研討會作為分會場的重要組成部分,備受期待。
AI視頻生成技術(shù)研討會定于第二日上午舉行,涵蓋主題報告與圓桌Panel兩大環(huán)節(jié)。自年初Sora問世以來,AI視頻生成領域風起云涌,國內(nèi)外眾多參與者競相角逐。然而,該領域仍面臨諸多亟待解決的關(guān)鍵問題,學術(shù)界與工業(yè)界正共同努力,以期實現(xiàn)技術(shù)突破,提升視頻生成大模型及應用產(chǎn)品的用戶體驗。
此次研討會邀請了五位杰出的青年學者和技術(shù)專家,包括中存算董事長陳巍、上海交通大學人工智能研究院助理教授晏軼超、新壹科技AI算法主任架構(gòu)師李璋、井英科技聯(lián)合創(chuàng)始人兼CTO王健以及曠視研究院高級研究員李華東。他們將圍繞視頻大模型架構(gòu)比較、三維數(shù)字人視頻生成、面向數(shù)字人生成的視頻垂直大模型、AI短劇技術(shù)突破以及可控人物視頻生成等前沿話題展開深入講解。
陳巍博士將對比主流視頻生成大模型架構(gòu),探討內(nèi)存墻和通信墻對視頻大模型訓練的挑戰(zhàn),并分享算力芯片級訓練部署的解決方案。晏軼超教授將介紹三維數(shù)字人視頻生成的最新進展,探討發(fā)展趨勢。李璋將分享新壹視頻大模型在數(shù)字人視頻生成中的核心技術(shù)突破,展示典型應用案例。王健將分享井英科技在AI短劇制作中的關(guān)鍵技術(shù)突破,探討商業(yè)模式。李華東則將介紹支持混合模態(tài)控制的人像視頻生成算法MegActor系列工作。
陳巍博士在《視頻大模型架構(gòu)對比及長序列模型加速》的報告中指出,視頻大模型與短視頻產(chǎn)業(yè)的結(jié)合正迎來新的爆發(fā)機遇,他深入探討了視頻生成大模型的關(guān)鍵技術(shù)及其面臨的挑戰(zhàn),分享了針對視頻長序列模型算力芯片級訓練部署的解決方案與系統(tǒng)經(jīng)驗。
晏軼超教授在《先驗引導的三維數(shù)字人視頻生成》的報告中,從數(shù)字人重建、生成與編輯等方向介紹了數(shù)字人視頻生成領域的最新進展,并對三維數(shù)字人技術(shù)的發(fā)展趨勢進行了展望。
李璋在《視頻垂直大模型在智能數(shù)字人生成中的應用》的報告中,闡述了從通用大模型到垂直大模型的演進,介紹了新壹視頻大模型在數(shù)字人視頻生成中的核心技術(shù)突破,深入分析了自然語言驅(qū)動的動作與表情生成技術(shù),并展示了相關(guān)領域的典型應用案例。
王健在《AI短劇拐點背后的技術(shù)突破》的報告中,分享了井英科技通過視頻生成模型實現(xiàn)100分鐘以上短視頻制作的經(jīng)驗,探討了AI短劇從不可行到可行的關(guān)鍵技術(shù)突破,并展望了未來的商業(yè)模式。
李華東在《可控人物視頻生成》的報告中,介紹了MegActor系列工作,這是一種支持混合模態(tài)控制的人像視頻生成算法,能夠?qū)崿F(xiàn)角色自定義,通過視頻、音頻和文本輸入實現(xiàn)單獨和混合控制,為高質(zhì)量視頻內(nèi)容的生成提供了新的解決方案。
在圓桌Panel環(huán)節(jié),陳巍、晏軼超、王健和李華東將圍繞AI視頻生成領域的熱點話題展開深入討論,為參會者帶來更多啟發(fā)與思考。