訊飛輸入法語音輸入升級現(xiàn)真功除了高效準(zhǔn)確還能隨心說

時間：2019-01-24 16:50:25 來源：互聯(lián)網(wǎng)編輯：星輝 發(fā)表評論無障礙通道

說起人工智能AI，一般看到的都是上天下地的機器人、計算機視覺、自動駕駛之類，電影電視就更夸張了，動不動就出現(xiàn)AI威脅論這樣的情節(jié)。但實際上，AI應(yīng)用并沒有局限在這些看似“高大上”的領(lǐng)域中，相反的，逐漸成為大多數(shù)人“觸手可及”的便利，比如手機輸入法。日前訊飛輸入法新版已經(jīng)支持中英混合語音輸入，對普通話與七種方言口音的混合語音輸入效果進行了優(yōu)化，“動口不動手”的未來近在眼前。

$D:\工作文檔\文案\201901匯總\AndroidV8.1.8433新版\V8.1.8433應(yīng)用截圖\V8.1.8432應(yīng)用截圖\VIVO應(yīng)用市場測試宣傳圖\vivo市場截圖-assets\vivo市場截圖-assets\2.png$

如今，語音輸入又快又準(zhǔn)，似乎沒什么不足。據(jù)最新第三方輸入法報告顯示，用戶對語音輸入除了要求“高效準(zhǔn)確”，還要求“簡單便捷”。譬如，職場上時不時說中文夾雜英文，回家后說普通話自然接上家鄉(xiāng)話!所以上班說事切換到英文識別模式，回家切換到對應(yīng)的方言模式。如果想擁有“雅俗共賞”的溝通效果，那可能就麻煩了，需要在中英、英中、普通話與方言、方言與普通話、英文與方言中循環(huán)往復(fù)地手動切換操作。

眾多周知，訊飛輸入法語音輸入速度1分鐘400字，語音識別準(zhǔn)確率高達98%，支持23種方言語音輸入，日前上線了語音輸入『隨心說』，解決了頻繁切換識別模式的痛點。這個『隨心說』已經(jīng)實現(xiàn)中英混合語音輸入，也優(yōu)化了東北話/天津話/河南話/河北話/山東話/皖北話/四川話七種方言與普通話的混合語音輸入效果。這是怎么做到的?

據(jù)悉，此次訊飛輸入法在深度全序列卷積神經(jīng)網(wǎng)絡(luò)語音識別框架基礎(chǔ)上，將傳統(tǒng)卷積使用擴張卷積代替，讓每個卷積輸出都包含更大范圍的信息，從而使得模型實現(xiàn)對語音長時相關(guān)性的更精確的表達。與此同時，還引入基于長短期記憶網(wǎng)絡(luò)的門控機制使得Hybrid CNN在長時相關(guān)性建模的過程中，能快速過濾噪聲等干擾信息，并加強語境等長時信息，從而在實際應(yīng)用中能夠保障復(fù)雜場景的語音識別效果。

另一個重要的地方在于，Hybrid CNN模型真正實現(xiàn)了端到端的建模，此前的端到端建模方案如CTC等在輸出端已經(jīng)可以做到直接輸出中文漢字，取得了一定的效果提升，但在輸入端仍然采用人工設(shè)計的特征，在特殊場景下難免會損失信息。科大訊飛這次以原始音頻波形直接建模，避免了人工設(shè)計的特征提取過程帶來的信息損失，真正的實現(xiàn)了端到端建模，進一步的提升了識別效果。

從實用性上考慮，Hybrid CNN新一代語音識別框架克服了DFCNN模型參數(shù)量和計算復(fù)雜度大的問題，比較容易實現(xiàn)大規(guī)模并行化運算，在保證識別效果不損失的情況下，系統(tǒng)資源占用規(guī)模和運算量同比下降了60%以上，使得Hybrid CNN可以在手機等設(shè)備上流暢的運行，帶來的好處還包括使本地化語音的識別效果更加接近云端識別效果。

這兩年處處可見AI刷屏，涌現(xiàn)出不少驚人的突破，國家也正式發(fā)布《新一代人工智能的發(fā)展規(guī)劃》，其中關(guān)于AI應(yīng)用占了不少篇幅。現(xiàn)實中也經(jīng)常能看到AI的身影，比較突出的是訊飛輸入法將AI技術(shù)落地，訊飛黑科技不再只是存在科幻情結(jié)中。這次中英等混合語音輸入的『隨心說』有效增進人機互動，讓大眾接觸到、用起來，這是非常好的落地。

12月16日，訊飛AI錄音筆旗艦新品S8離線版重磅上市。該款產(chǎn)品為完全隔絕外界網(wǎng)絡(luò)轉(zhuǎn)文字AI錄音設(shè)備，其所有功能均在本地實現(xiàn)，為對安全性有嚴格要求的用戶群提供了新工具。數(shù)據(jù)泄露事件頻發(fā)，信息保護需求凸顯數(shù)字世界以網(wǎng)絡(luò)連接為基礎(chǔ)，以數(shù)據(jù)流動釋放價值。在數(shù)字化浪潮

時至十二月，又是一年終末。伴隨著12.12的來臨，廠商們紛紛開啟了新一輪的促銷優(yōu)惠。作為年末備受期待的好物節(jié)，聲勢浩大的促銷無疑是大家挑選心儀好物的好機會。如果你想在近期為自己選購一款智能手表來激勵運動監(jiān)測健康，不妨嘗試一下最新的三星Galaxy Watch7和三星Ga

2024年進入尾聲，國補政策即將在12月31日結(jié)束，還尚未使用筆記本國補資格的消費者朋友們不妨關(guān)注高顏值游戲本華碩天選5Pro銳龍版，其搭載GeForce RTX 4070筆記本電腦GPU，NVIDIA GeForce RTX? 和 NVIDIA RTX? GPU 專為 AI 時代打造。RTX GPU 由業(yè)界領(lǐng)先的 NVIDIA GPU

《使命召喚：黑色行動6》是由Treyarch和Raven Software聯(lián)合開發(fā)，并由動視發(fā)行的第一人稱射擊游戲，于2024年10月25日正式發(fā)布。游戲上線Steam后，獲得了廣大玩家的好評。動視官方也宣稱，《使命召喚：黑色行動6》成為《使命召喚》系列中首發(fā)最成功的作。在游戲正式發(fā)布

由GSC Game World開發(fā)并發(fā)行的《潛行者2:切爾諾貝利之心》已在STEAM正式上線,這是一款探索冒險題材的第一人稱射擊游戲。游戲以2006年第二次核反應(yīng)堆爆炸事件為背景,玩家將化身為一名“潛行者”,面對一場史詩級的危險戰(zhàn)斗。游戲首發(fā)即支持NVIDIA DLSS 3技術(shù),搭載耕升 GeF

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

訊飛輸入法語音輸入升級現(xiàn)真功 除了高效準(zhǔn)確還能隨心說

訊飛輸入法語音輸入升級現(xiàn)真功除了高效準(zhǔn)確還能隨心說