滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

中國移動與南京大學聯(lián)手，打造高保真2D數(shù)字人客服新體驗！

時間：2024-12-09 13:19:13 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近日，中國移動攜手南京大學團隊，在人工智能領(lǐng)域取得了一項重要突破，成功研發(fā)出了一種高保真2D數(shù)字人說話驅(qū)動系統(tǒng)。這一創(chuàng)新旨在優(yōu)化客戶服務體驗，降低運營成本，并為智能客服、教育培訓及廣告營銷等多個領(lǐng)域帶來革新。

作為全球用戶規(guī)模最大的通信運營商，中國移動面臨著巨大的客戶服務需求。盡管智能語音客服已經(jīng)廣泛應用于日常業(yè)務中，但其提供的服務體驗仍無法與人工客服的面對面、個性化服務相提并論。為了改善這一現(xiàn)狀，中國移動九天視覺團隊與南京大學邰穎團隊攜手，共同研發(fā)了這款高保真2D數(shù)字人說話驅(qū)動系統(tǒng)。

該系統(tǒng)能夠根據(jù)目標人物的照片或視頻以及任意音頻，生成與之同步的說話視頻流。生成的數(shù)字人形象逼真，表情姿態(tài)自然，且具備較高的實時性。這一技術(shù)不僅實現(xiàn)了人物數(shù)字替身的構(gòu)建，還與語言大模型、音頻合成能力進行了有機整合，為用戶提供了更為真實、自然的交互體驗。

在技術(shù)攻堅和方案創(chuàng)新方面，該系統(tǒng)取得了顯著的成果。首先，在實時播報口型生成技術(shù)上，該系統(tǒng)達到了學術(shù)界的領(lǐng)先水平，支持中英文數(shù)字人口型驅(qū)動，實時性能達到了30毫秒每幀。其次，通過研發(fā)二階段學習框架，系統(tǒng)將數(shù)字人說話驅(qū)動過程拆解為從音頻到口型系數(shù)、從口型系數(shù)到生成人像兩部分，降低了學習難度，提升了生成效果。最后，該系統(tǒng)還引入了情緒引導學習模塊，支持正常、微笑、驚訝、憤怒、恐懼、悲傷等七種主流情緒控制生成能力，使生成的數(shù)字人具備更加豐富的情感表達能力。

在實際應用中，該系統(tǒng)已經(jīng)實現(xiàn)了端到端的二階段30幀每秒實時生成性能，并支持512×512人臉區(qū)域生成。同時，該系統(tǒng)還具備高興、悲傷等七種主流情緒控制生成能力，為用戶帶來了更加豐富的視覺體驗。在評測集VoxCeleb指標方面，該技術(shù)的口型準確性LMD達到了4.3，生成自然度FID達到了11.1，均表現(xiàn)出色。

據(jù)中國移動官方介紹，這一研發(fā)成果的應用前景廣闊。它不僅有效降低了創(chuàng)作門檻，提升了生成人物的視覺質(zhì)量，還為5G新通話、和留言小秘書等品牌業(yè)務的拓展提供了有力支持。未來，隨著技術(shù)的不斷成熟和應用場景的不斷拓展，這一系統(tǒng)有望為更多領(lǐng)域帶來創(chuàng)新和變革。

舉報 0 收藏 0 打賞 0評論 0

01-06

聲網(wǎng)Conversational AI Agents連獲三獎，實時對話AI解決方案備受認可！

01-06

三星Galaxy S25 Slim來襲，6.5mm輕薄機身挑戰(zhàn)iPhone 17 Air

01-06

2024大模型市場火熱！科大訊飛領(lǐng)跑中標榜，多家AI企業(yè)嶄露頭角

01-06

滬指弱勢震蕩險守3200，醫(yī)藥算力活躍能否引領(lǐng)市場反彈？

01-06

2024大模型市場火爆，科大訊飛領(lǐng)跑中標榜，誰將成為下一匹黑馬？

01-06

AIGC創(chuàng)意素材新探索：從「即創(chuàng)」優(yōu)秀案例中尋找靈感

01-06

小米MIX Fold 3大升級！澎湃OS 2.0.5.0正式版帶來多項全新功能與優(yōu)化

01-06

OpenAI奧爾特曼：2025年，首批AI智能體或?qū)⒆兏飫趧恿κ袌?/a>

01-06

小米官宣參展MWC 2025，互聯(lián)智能將如何塑造未來引期待

01-06

12月AI行業(yè)盤點：谷歌Gemini異軍突起，星野素材量暴漲3倍超越豆包

其中，Kimi智能助手在12月前處于明顯領(lǐng)先地位，12月起開始投放素材量開始下滑，同時，星野素材量大幅增加，二者投放素材量差距逐步減小，直至12月19日，星野正式反超Kimi智能助手，并在此后多數(shù)時間占據(jù)單…

01-06

愛奇藝指控MiniMax侵權(quán)，要求立即停止并索賠十萬

01-06

金磚國家AI發(fā)展中心上海啟航，共繪智能未來新藍圖

01-06

DeepSeek V3低成本高效能，AI界“拼多多”模式能否引領(lǐng)新潮流？

01-06

海爾合肥冰箱互聯(lián)工廠：AI領(lǐng)航，榮獲工業(yè)4.0“AI創(chuàng)新領(lǐng)航”全球首獎！

01-06

點擊查看更多 +

全站最新

哈弗H7插混版官圖曝光：簡約科技風，貫穿尾燈藏LOGO，無進氣格柵設(shè)計

2025年中國一拖“火力全開”，新年沖刺“開門紅”盛況空前！

駿瑪?shù)?025供應商年會：共謀發(fā)展新篇章，攜手布局新未來

華為Mate X6折疊屏旗艦預約開啟，90天等你擁抱科技新體驗！

吉利銀河L6/L7 EM-i哈爾濱首發(fā)，雷神電混技術(shù)能否再創(chuàng)續(xù)航神話？

哪吒汽車官網(wǎng)異常引倒閉猜測，官方：技術(shù)維護，已辟謠

熱門內(nèi)容

本欄最新

聲網(wǎng)Conversational AI Agents連獲三獎，實時對話AI解決方案備受認可！

三星Galaxy S25 Slim來襲，6.5mm輕薄機身挑戰(zhàn)iPhone 17 Air

2024大模型市場火熱！科大訊飛領(lǐng)跑中標榜，多家AI企業(yè)嶄露頭角

滬指弱勢震蕩險守3200，醫(yī)藥算力活躍能否引領(lǐng)市場反彈？

2024大模型市場火爆，科大訊飛領(lǐng)跑中標榜，誰將成為下一匹黑馬？

AIGC創(chuàng)意素材新探索：從「即創(chuàng)」優(yōu)秀案例中尋找靈感

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

中國移動與南京大學聯(lián)手，打造高保真2D數(shù)字人客服新體驗！

中國移動與南京大學聯(lián)手，打造高保真2D數(shù)字人客服新體驗！