10月24日,一年一度的人工智能盛會——科大訊飛全球開發(fā)者節(jié)在安徽合肥舉行。開發(fā)者大會現(xiàn)場,科大訊飛AI研究院常務(wù)副院長劉聰揭秘了科大訊飛衛(wèi)冕奪冠的背后故事——獨創(chuàng)的最新智能識別、合成與翻譯技術(shù)。
科大訊飛在業(yè)內(nèi)取得了一系列輝煌成績,僅今年便有多項賽事奪冠。6月,在ICDAR2019公式識別的比賽中,科大訊飛一舉獲得在線和離線識別兩項冠軍;8月,在國際語音合成大賽暴風(fēng)雪比賽中,科大訊飛以獨創(chuàng)性聽感量化編碼框架和GAN建模技術(shù)將自然度得分刷新至4.5MOS分歷史新高,衛(wèi)冕奪冠。
科大訊飛AI研究院常務(wù)副院長劉聰介紹說,在語音識別核心算法上,基于深度全序列卷積神經(jīng)網(wǎng)絡(luò)(Deep Fully CNN),科大訊飛創(chuàng)新研發(fā)出了高精度的記憶增強式多通道端到端語音識別技術(shù)。并通過分析語音輸入、語音交互和語音記錄這三大典型應(yīng)用場景,不斷實現(xiàn)語音識別的真正落地。與此同時,基于語義分割與自適應(yīng)感受野的通用圖文識別核心技術(shù),加速OCR的本地化布局,通過“云+端”的模式為用戶提供更好的產(chǎn)品體驗。此外,劉聰表示,融合領(lǐng)域知識的多通道半監(jiān)督約束編解碼翻譯技術(shù),提升專業(yè)術(shù)語詞和行業(yè)翻譯專業(yè)性,是科大訊飛通過CATTI專業(yè)測試的核心算法秘訣。
科大訊飛作為國家開發(fā)創(chuàng)新平臺,秉承以“以技術(shù)為基石,以開發(fā)者為本”的理念,旨在為開發(fā)者持續(xù)帶來核心技術(shù)紅利。2010年,科大訊飛發(fā)布以智能語音和人機交互為核心的人工智能開放平臺——訊飛開放平臺。為了更全面地服務(wù)各類型各階段的開發(fā)者與企業(yè)用戶,訊飛開放平臺陸續(xù)推出了提供人工智能專業(yè)知識服務(wù)的在線學(xué)習(xí)平臺——“AI大學(xué)”。以及提供專業(yè)資源服務(wù)的“訊飛A.I.服務(wù)市場”。這成為國內(nèi)知名的融匯人工智能開發(fā)者、研究者、學(xué)習(xí)者、創(chuàng)業(yè)者的生態(tài)開放大平臺。如今,全新iFLYOS 2.0為了滿足廣大開發(fā)者的自定義需求,在開放度上進一步提升,在用戶體系、語義服務(wù)、智能硬件操作系統(tǒng)開發(fā)等層面滿足開發(fā)者自定義需求。同時,科大訊飛還聯(lián)合生態(tài)合作伙伴,為人工智能賦能的各行業(yè)量身定制高靈活性、高集成性、高可靠性安全架構(gòu)的專用語音芯片。
正如劉聰所說,伴隨著5G和萬物互聯(lián)時代的到來,科大訊飛將懷抱開放共贏的心態(tài)、依托核心關(guān)鍵技術(shù),聚焦于探索智能識別與合成應(yīng)用的更高階段,逐步跨越行業(yè)促進應(yīng)用價值的深化挖掘,給人們帶來全新的產(chǎn)品和升級的用戶體驗。