滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗再升級！

時間：2024-11-14 19:17:27 來源：ITBEAR編輯：快訊團(tuán)隊 發(fā)表評論無障礙通道

【ITBEAR】訊飛開放平臺今日宣布重大進(jìn)展，其全新研發(fā)的訊飛星火多模態(tài)交互大模型已正式上線。這一技術(shù)突破實現(xiàn)了從單一的語音交互到音視頻流實時多模態(tài)交互的跨越，為用戶帶來更為豐富和自然的交互體驗。

訊飛星火多模態(tài)交互大模型首次引入了超擬人數(shù)字人技術(shù)，該技術(shù)使得數(shù)字人的軀干和四肢動作能夠與語音內(nèi)容精準(zhǔn)匹配，快速生成相應(yīng)的表情和動作，從而讓AI形象更加栩栩如生。通過統(tǒng)一文本、語音和表情的表達(dá)，該模型在跨模態(tài)的語義一致性上取得了顯著成效，使得大模型的情感表達(dá)更為真實和連貫。

在交互速度方面，該模型同樣表現(xiàn)出色。它采用了統(tǒng)一的神經(jīng)網(wǎng)絡(luò)，直接實現(xiàn)了語音到語音的端到端建模，從而大大提升了響應(yīng)速度和流暢性。該模型還能夠敏銳地感知用戶的情緒變化，并根據(jù)指令自由調(diào)整聲音的節(jié)奏、大小和人設(shè)，為用戶提供更加個性化的交互體驗。

訊飛星火多模態(tài)交互大模型還支持多模態(tài)視覺交互。它不僅能夠“聽懂世界”，更能“認(rèn)清萬物”，通過全面感知具體的背景場景、物流狀態(tài)等信息，對任務(wù)的理解更加精準(zhǔn)。同時，該模型還能夠綜合判斷語音、手勢、行為和情緒等多種信息，作出更為合適的響應(yīng)。

據(jù)此前報道，用戶已經(jīng)可以與數(shù)字人進(jìn)行自然的語音和視頻通話。在通話過程中，數(shù)字人不僅能夠?qū)崿F(xiàn)與用戶的自然語音對話，其人物表情等也能夠與說話語句相匹配。星火超擬人數(shù)字人還支持多模態(tài)交互功能，這使得數(shù)字人能夠識別攝像頭中的內(nèi)容，如識別孫悟空和奧特曼站在一起、識別面霜的品牌和作用以及花的品類等。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

安卓芯片單核性能飆升，蘋果A18 Pro地位還保得住嗎？

01-04

安卓芯片新突破，單核能否撼動蘋果A18 Pro地位？

01-04

馬斯克宣布：Grok 3已完成預(yù)訓(xùn)練，計算量大幅提升10倍！

三言科技 1月4日消息，今日馬斯克在X平臺宣布：Grok 3即將推出，其預(yù)訓(xùn)練現(xiàn)已完成，計算量比Grok 2高10倍。據(jù)了解，去年12月14日，xAI宣布向所有X平臺用戶免費推出新版本Grok-2模型?！?/div>

01-04

DeepSeek團(tuán)隊揭秘：清北應(yīng)屆生領(lǐng)銜，年輕力量如何撐起AI大模型新篇章？

01-04

谷歌DeepMind新成果：CAT4D讓普通視頻秒變動態(tài)3D場景

01-04

馬斯克官宣：Grok 3預(yù)訓(xùn)練完成，計算量飆升十倍即將面世！

01-04

我國AI技術(shù)新突破！博鰲超級醫(yī)院成功應(yīng)用全球首個人工智能耳蝸植入系統(tǒng)

01-04

2025搜索大戰(zhàn)一觸即發(fā)，谷歌能否保住王座？

01-04

微軟2025財年AI數(shù)據(jù)中心投資將超800億美元，過半資金投美國

01-04

AI教育新突破！精準(zhǔn)學(xué)超擬人老師，能否成為孩子作業(yè)輔導(dǎo)新救星？

01-03

寒武紀(jì)七年虧損路，陳天石身家760億，AI芯片龍頭何時扭虧為盈？

01-03

零售數(shù)字化新紀(jì)元：多點數(shù)智Dmall OS 3.0引領(lǐng)行業(yè)飛躍

01-03

AI賦能企業(yè)新升級，智慧發(fā)票助手打造高效財務(wù)管理

01-03

容聯(lián)云12月征程：AI生產(chǎn)力如何從夢想照進(jìn)現(xiàn)實？

01-03

2024教育頭部企業(yè)風(fēng)云：新東方文旅崛起，好未來AI領(lǐng)跑，誰將續(xù)寫輝煌？

其中今年最新季度，高途凈收入為12.1 億元，同比去年同期的7.9億元增長 53.1%，該公司表示，其教育產(chǎn)品和學(xué)習(xí)服務(wù)提高了消費者對其產(chǎn)品和服務(wù)的認(rèn)可度。截至今年最新財報季的前九個月，一起教育公司凈…

01-03

點擊查看更多 +

全站最新

手機(jī)QQ空間輕松進(jìn)，功能全解析與注意事項分享

比亞迪海豚2025款來襲，續(xù)航超500公里，智能配置全面升級！

比亞迪T5混動輕卡長途挑戰(zhàn)，滿電滿油續(xù)航破千公里，物流新時代已來？

2025車市展望：價格戰(zhàn)陰霾籠罩，新能源賽道如何破局？

奧迪Q7大改款來襲！分體大燈貫穿尾燈，全新Q7年內(nèi)發(fā)布

廣汽飛行汽車來襲！40分鐘200公里，大灣區(qū)立體交通新時代？

熱門內(nèi)容

本欄最新

安卓芯片單核性能飆升，蘋果A18 Pro地位還保得住嗎？

安卓芯片新突破，單核能否撼動蘋果A18 Pro地位？

DeepSeek團(tuán)隊揭秘：清北應(yīng)屆生領(lǐng)銜，年輕力量如何撐起AI大模型新篇章？

谷歌DeepMind新成果：CAT4D讓普通視頻秒變動態(tài)3D場景

馬斯克官宣：Grok 3預(yù)訓(xùn)練完成，計算量飆升十倍即將面世！

我國AI技術(shù)新突破！博鰲超級醫(yī)院成功應(yīng)用全球首個人工智能耳蝸植入系統(tǒng)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

<menu id="wywoc"></menu>

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗再升級！

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗再升級！