滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

豆包APP升級(jí)實(shí)時(shí)語音通話，中文對(duì)話能力飛躍，人機(jī)對(duì)話難分辨！

時(shí)間：2025-01-22 14:29:06 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

近日，豆包APP宣布了一項(xiàng)重大更新，正式推出了面向全體用戶的實(shí)時(shí)語音通話功能，這一創(chuàng)新舉措標(biāo)志著豆包在人工智能語音交互領(lǐng)域邁出了重要一步。

豆包此次推出的實(shí)時(shí)語音通話功能，是基于其自主研發(fā)的豆包實(shí)時(shí)語音大模型（Doubao Realtime Voice Model）實(shí)現(xiàn)的。這一模型在中文場(chǎng)景下的對(duì)話能力表現(xiàn)卓越，不僅在語音的真實(shí)感和情緒的細(xì)膩表達(dá)上達(dá)到了“人機(jī)難辨”的境界，還能靈活模仿多種聲線，并在邏輯思考和情緒感知方面實(shí)現(xiàn)了顯著提升。

在實(shí)際測(cè)試中，豆包APP的全新實(shí)時(shí)語音通話功能展現(xiàn)出了令人驚嘆的真人級(jí)交互效果。其語音表現(xiàn)自然流暢，智力水平也極具擬人性，相較于市面上大多數(shù)仍在語氣層面進(jìn)行簡(jiǎn)單變化的語音系統(tǒng)，豆包能夠根據(jù)具體場(chǎng)景精準(zhǔn)把控節(jié)奏、兒化音、音量、氣音等細(xì)節(jié)，甚至能夠與用戶進(jìn)行悄聲對(duì)話，營(yíng)造出更加私密和真實(shí)的交流氛圍。

除了出色的語音表現(xiàn)外，豆包在情緒表達(dá)方面也頗為亮眼。它能夠準(zhǔn)確捕捉并模仿用戶的喜怒哀樂，還掌握了部分方言與英語對(duì)話的能力，能夠進(jìn)行多角色模仿，甚至具備一定的歌曲演唱能力。在日常使用中，豆包既可以作為英語陪練老師，為用戶提供專業(yè)的語言指導(dǎo)，也可以化身講故事高手，為用戶帶來豐富的娛樂體驗(yàn)，更可以即興創(chuàng)作歌曲，展現(xiàn)其多才多藝的一面。

據(jù)了解，傳統(tǒng)語音對(duì)話任務(wù)系統(tǒng)通常采用ASR+LLM+TTS的級(jí)聯(lián)模式，但在真人級(jí)語音對(duì)話的理解完整度、生成自然度、交互低延時(shí)等方面存在諸多不足。而豆包則采用了創(chuàng)新的端到端框架，通過原生方法深度融合語音與文本模態(tài)進(jìn)行統(tǒng)一建模，實(shí)現(xiàn)了從多模態(tài)輸入到多模態(tài)輸出的無縫轉(zhuǎn)換，為AI語音對(duì)話賦予了“靈魂”。

在交付體驗(yàn)上，豆包語音對(duì)話在確保模型具備強(qiáng)大理解和邏輯能力的同時(shí)，還實(shí)現(xiàn)了超低延時(shí)和流暢打斷的功能。這意味著用戶在與豆包進(jìn)行對(duì)話時(shí)，可以享受到更加流暢和自然的交互體驗(yàn)，無需擔(dān)心因延時(shí)或打斷而導(dǎo)致的溝通障礙。

豆包全新實(shí)時(shí)語音通話功能的推出，無疑使其在同類產(chǎn)品中脫穎而出。根據(jù)外部真實(shí)反饋數(shù)據(jù)顯示，用戶對(duì)豆包此次上線的全新語音通話功能整體滿意度高達(dá)4.36/5，遠(yuǎn)高于GPT-4o語音對(duì)話的3.18/5。尤其在語音語氣自然度和情緒飽滿度方面，豆包展現(xiàn)出了明顯的優(yōu)勢(shì)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

字節(jié)跳動(dòng)120億美金投AI？官方：不實(shí)傳聞！

北京時(shí)間1月22日，有消息稱字節(jié)跳動(dòng)今年在人工智能基礎(chǔ)設(shè)施上投入超120億美元，其中為2025年購(gòu)買AI芯片準(zhǔn)備了400億人民幣，是2024年支出的兩倍。另計(jì)劃在海外投資約68億美元。對(duì)此，字節(jié)跳動(dòng)相關(guān)人士回…

01-22

谷歌再擲10億美元加碼投資，Anthropic成OpenAI強(qiáng)勁對(duì)手？

01-22

微軟調(diào)整協(xié)議，OpenAI獲準(zhǔn)使用多家云服務(wù)

微軟改變了與OpenAI的多年協(xié)議，現(xiàn)在允許這家人工智能初創(chuàng)公司使用競(jìng)爭(zhēng)對(duì)手提供的云計(jì)算服務(wù)。微軟周二在聲明中表示，該協(xié)議將持續(xù)到2030年，當(dāng)OpenAI尋求計(jì)算能力以訓(xùn)練和運(yùn)行人工智能模型時(shí)，微軟將擁有優(yōu)…

01-22

網(wǎng)易有道開源“子曰-o1”，打造國(guó)內(nèi)首個(gè)分步式講解推理模型

01-22

DeepSeek-R1橫空出世，能否挑戰(zhàn)OpenAI o1霸主地位？

01-22

字節(jié)跳動(dòng)豆包大模型1.5 Pro重磅發(fā)布，綜合能力超越GPT-4o等模型

01-22

字節(jié)跳動(dòng)120億投資AI？官方：消息不實(shí)

01-22

字節(jié)跳動(dòng)否認(rèn)120億美元投AI基礎(chǔ)設(shè)施，真相如何？

01-22

榮耀前CEO趙明離職背后：上市前夕緣何失去董事會(huì)信任？

01-22

陳天橋布局AI新戰(zhàn)略：盛大以研究為魂，雙研究院驅(qū)動(dòng)未來

01-22

微軟調(diào)整與OpenAI合作：OpenAI獲算力自主權(quán)，共啟5000億“星際之門”項(xiàng)目

01-22

美圖奇想大模型登頂VBench，視頻生成質(zhì)量奪冠展現(xiàn)美學(xué)實(shí)力

01-22

華為Pura 70 Ultra新色登場(chǎng)，瑞紅玄黑賀新春，原生鴻蒙開啟智能新篇章

01-22

網(wǎng)易有道發(fā)布“子曰-o1”推理模型，國(guó)內(nèi)首創(chuàng)分步式解題講解

01-22

特朗普宣布OpenAI、軟銀和甲骨文將投500億建AI基礎(chǔ)設(shè)施

Stargate intends to invest $500 billion over the next four yearsbuilding new AI infrastructure for Ope…

01-22

點(diǎn)擊查看更多 +

全站最新

麗水車主注意！春節(jié)應(yīng)急搶修服務(wù)隊(duì)24小時(shí)待命，安心出行全靠它！

iCAR V23西安震撼上市，風(fēng)格越野新體驗(yàn)，售價(jià)9.98萬元起！

動(dòng)手折蝴蝶結(jié)，解鎖放松心情新技能！

《穿越火線》：射擊快感與社交魅力，你get到了嗎？

捷途縱橫G900來襲，水陸空全棲越野能否撼動(dòng)仰望U8地位？

國(guó)產(chǎn)汽車出海潮：中國(guó)穩(wěn)坐全球最大汽車出口國(guó)寶座，年銷量突破600萬

熱門內(nèi)容

本欄最新

網(wǎng)易有道開源“子曰-o1”，打造國(guó)內(nèi)首個(gè)分步式講解推理模型

DeepSeek-R1橫空出世，能否挑戰(zhàn)OpenAI o1霸主地位？

字節(jié)跳動(dòng)豆包大模型1.5 Pro重磅發(fā)布，綜合能力超越GPT-4o等模型

榮耀前CEO趙明離職背后：上市前夕緣何失去董事會(huì)信任？

陳天橋布局AI新戰(zhàn)略：盛大以研究為魂，雙研究院驅(qū)動(dòng)未來

華為Pura 70 Ultra新色登場(chǎng)，瑞紅玄黑賀新春，原生鴻蒙開啟智能新篇章

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

豆包APP升級(jí)實(shí)時(shí)語音通話，中文對(duì)話能力飛躍，人機(jī)對(duì)話難分辨！

豆包APP升級(jí)實(shí)時(shí)語音通話，中文對(duì)話能力飛躍，人機(jī)對(duì)話難分辨！