ITBear旗下自媒體矩陣:

訊飛智作推超擬人數(shù)字人,大模型技術(shù)表情動(dòng)作逼近真人!

   時(shí)間:2024-10-25 19:17:50 來源:ITBEAR作者:楊凌霄編輯:瑞雪 發(fā)表評(píng)論無障礙通道

【ITBEAR】在合肥奧體中心,第七屆世界聲博會(huì)暨科大訊飛全球1024開發(fā)者節(jié)盛大開幕,科大訊飛借此機(jī)會(huì)展示了其最新的多模態(tài)視覺交互技術(shù)和超擬人數(shù)字人。這一創(chuàng)新不僅震撼了行業(yè),也預(yù)示著數(shù)字人技術(shù)的新篇章。

科大訊飛研究院院長劉聰在活動(dòng)現(xiàn)場(chǎng)演示了如何通過一張照片快速生成超擬人數(shù)字人,這一技術(shù)極大簡化了數(shù)字人的定制流程,降低了應(yīng)用門檻。用戶只需上傳個(gè)人照片,便能獲得一個(gè)高度擬真的數(shù)字人形象。

除了形象定制,科大訊飛還推出了情感貫穿的多模態(tài)交互技術(shù),使數(shù)字人能夠根據(jù)語境實(shí)時(shí)調(diào)整表情,實(shí)現(xiàn)更自然的情感表達(dá)。這一技術(shù)讓數(shù)字人的面部表情更加生動(dòng),情感傳遞更加準(zhǔn)確。

在肢體動(dòng)作驅(qū)動(dòng)方面,科大訊飛也實(shí)現(xiàn)了技術(shù)創(chuàng)新。超擬人數(shù)字人的肢體動(dòng)作能夠根據(jù)語音的節(jié)奏、語調(diào)和內(nèi)容實(shí)時(shí)生成,擺脫了預(yù)設(shè)模板動(dòng)作的限制,提升了數(shù)字人在動(dòng)態(tài)場(chǎng)景中的表現(xiàn)力。

科大訊飛還采用了中間表征壓縮技術(shù),提升了數(shù)字人在多場(chǎng)景下的實(shí)時(shí)交互能力。這一技術(shù)有效壓縮了視頻維度,減少了計(jì)算量,保障了數(shù)字人與用戶的實(shí)時(shí)互動(dòng)。

科大訊飛數(shù)字人技術(shù)已廣泛應(yīng)用于金融、政務(wù)、文旅、商業(yè)、展會(huì)等多個(gè)領(lǐng)域。訊飛智作作為智能內(nèi)容創(chuàng)作基地,結(jié)合星火認(rèn)知大模型,為用戶提供一站式的虛擬人解決方案,降低了服務(wù)成本,提升了用戶體驗(yàn)。

目前,首發(fā)超擬人虛擬人的內(nèi)測(cè)通道已在訊飛智作小程序上開放。依托星火大模型的基座能力,用戶可以實(shí)現(xiàn)任意一張照片的快速驅(qū)動(dòng)生成,定制屬于自己的超擬人數(shù)字人。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容