中新網(wǎng)12月19日電 據(jù)美國《福布斯》12月18日報道,百度語音識別技術取得世界級突破,在嘈雜環(huán)境下的語音識別率明顯優(yōu)于Google、蘋果等科技巨頭。
這項技術突破是百度CEO李彥宏的前瞻性視野和技術布局結(jié)出的碩果之一。2013年初,百度成立深度學習研究院,李彥宏親自擔任院長,將語音和圖像作為重點突破方向,面向全球廣攬賢才。今年5月,百度研究院組建,下轄北京深度學習實驗室、大數(shù)據(jù)實驗室和硅谷人工智能實驗室。李彥宏將全球最為知名的人工智能專家吳恩達招致麾下,出任百度首席科學家。如今,群星璀璨的百度研究院云集了一大批世界頂級人工智能專家,在語音和圖像等領域取得了突出進展,引領著全球人工智能的技術創(chuàng)新。這些技術成果正在被快速應用于百度生態(tài)的產(chǎn)品與服務當中,讓用戶廣為受益。
《福布斯》報道說,百度研發(fā)的“Deep Speech”是一款采用深度學習技術的語音識別系統(tǒng),它可以在飯店等嘈雜環(huán)境下實現(xiàn)將近81% 的辨識準確率。相比之下,其他商業(yè)版語音識別API,包括Bing、Google 以及Wit.AI 等的最高識別率卻只有65%。與頂級的學術型語音識別模型相比,Deep Speech也高出了9個百分點。吳恩達透露,“Deep Speech”的成功很大程度上要取決于百度規(guī)模龐大的深度學習基礎設施,這比他在斯坦福和谷歌使用的系統(tǒng)運行速度快了近40倍。
過去的半個世紀里,伴隨創(chuàng)新加速,用戶的技術使用門檻在不斷降低,移動時代表達需求的方式更是發(fā)生著巨大變化。在今年百度世界大會上,李彥宏提出他對于未來科技發(fā)展的行業(yè)洞察——科技正在回歸人性。語音的歷史已有二十萬年,是人類自然的、低門檻的表達方式之一。他認為:“未來5年,消費者使用語音和圖像表達需求的比例將超過50%”。
首屆百度技術節(jié)進一步明確了百度語音技術的應用方向——推動手機和物聯(lián)網(wǎng)兩場革命。當前,物聯(lián)網(wǎng)將傳感器、控制器、人和物等通過互聯(lián)網(wǎng)技術連接在一起,語音技術的成熟將進一步提升物聯(lián)網(wǎng)的智能化連接。未來人們?nèi)粘J褂玫募译娫O備,如電視機、微波爐、音樂播放器等,都可以通過語音指令操控,提升用戶在移動時代的智能生活體驗。