【ITBEAR】在第七屆世界聲博會(huì)與科大訊飛全球1024開(kāi)發(fā)者節(jié)的盛會(huì)上,科大訊飛震撼發(fā)布了其最新的多模態(tài)視覺(jué)交互技術(shù)和超擬人數(shù)字人成果。這項(xiàng)技術(shù)僅需用戶上傳一張照片,即可實(shí)現(xiàn)與數(shù)字人的面對(duì)面實(shí)時(shí)交流。
科大訊飛展示的超擬人數(shù)字人,在口唇動(dòng)作、面部表情及身體姿態(tài)上,均由先進(jìn)的大模型自動(dòng)生成,且與文本意圖高度匹配,展現(xiàn)了極高的智能化水平。
目前,這項(xiàng)超擬人數(shù)字人技術(shù)已在科大訊飛旗下的訊飛智作產(chǎn)品中開(kāi)啟內(nèi)測(cè),標(biāo)志著該技術(shù)正逐步走向?qū)嶋H應(yīng)用。