1 月 7 日消息,微軟正式宣布,在基于微軟智能云 Azure 的深度神經(jīng)網(wǎng)絡(luò) TTS(Text-to-Speech)支持下,智能電動(dòng)汽車(chē)公司小鵬汽車(chē)已經(jīng)順利完成其車(chē)規(guī)級(jí)語(yǔ)音助手的升級(jí),進(jìn)一步提升智能汽車(chē)語(yǔ)音助手的技術(shù)水準(zhǔn)。
目前,購(gòu)買(mǎi)小鵬汽車(chē) P7 車(chē)型的中國(guó)用戶,可以通過(guò) OTA(Over-The-Air)升級(jí)這款可媲美人聲的全新智能語(yǔ)音助手“小 P”,小鵬汽車(chē)也計(jì)劃通過(guò) OTA 將這一技術(shù)升級(jí)引入其他幾款車(chē)型當(dāng)中。
據(jù)介紹,在為期數(shù)月的合作中,微軟與小鵬汽車(chē)攜手攻克了語(yǔ)音合成技術(shù)應(yīng)用面臨的三個(gè)技術(shù)挑戰(zhàn):首先,為了解決汽車(chē)場(chǎng)景下的網(wǎng)絡(luò)抖動(dòng)問(wèn)題,高質(zhì)量保障語(yǔ)音功能的持續(xù)運(yùn)行,小鵬汽車(chē)搭建了多級(jí)緩存架構(gòu),可以提前預(yù)置和緩存高質(zhì)量語(yǔ)音文件,最大程度上降低了該功能對(duì)網(wǎng)絡(luò)的依賴;其次,為了在不占用過(guò)多資源的前提下,依然能提供媲美人類的真實(shí)聲音體驗(yàn),小鵬汽車(chē)借助了微軟智能云 Azure 的緩存和壓縮功能,可以將語(yǔ)音文件壓縮到 24KHz 的采樣率和 16 位的量化水平,大大減少了數(shù)據(jù)網(wǎng)絡(luò)和整車(chē)算力的資源壓力;最后,雙方還在減少合成語(yǔ)音歧義和多音字優(yōu)化準(zhǔn)確性方面做出了諸多改進(jìn)。