ITBear旗下自媒體矩陣:

智能語(yǔ)音做下一個(gè)交互入口 哪些場(chǎng)景才是未來(lái)?

   時(shí)間:2016-05-30 08:46:14 來(lái)源:網(wǎng)易科技編輯:星輝 發(fā)表評(píng)論無(wú)障礙通道
智能語(yǔ)音做下一個(gè)交互入口 哪些場(chǎng)景才是未來(lái)?

編者按:5月29日下午,有網(wǎng)易科技&智能硬件主辦的第四季開(kāi)物沙龍?jiān)诒本┡e行,本次主題為智能語(yǔ)音與聊天機(jī)器人。微軟資深產(chǎn)品總監(jiān)、小娜項(xiàng)目負(fù)責(zé)人閆勃,ROOBO CTO雷宇,云知聲CTO梁家恩,海知智能CEO謝殿俠,思必馳CMO龍夢(mèng)竹,出門問(wèn)問(wèn)NLP工程師李理分別發(fā)表了演講。與此同時(shí),北極光創(chuàng)投副總裁蔡偉還與以上嘉賓進(jìn)行了深度交流與討論。包括智能語(yǔ)音和聊天機(jī)器人都有哪些進(jìn)步?智能語(yǔ)音是不是下一個(gè)互聯(lián)網(wǎng)入口?目前聊天機(jī)器人的瓶頸到底是什么?哪些語(yǔ)音交互場(chǎng)景最具增長(zhǎng)潛力?等等。

智能語(yǔ)音在最近得到了國(guó)外互聯(lián)網(wǎng)巨頭得到了相當(dāng)程度的重視。除了蘋果推出的Siri,谷歌發(fā)布的Google Now,以及微軟推出的Cortana(小娜)以外,亞馬遜近段時(shí)間大力推廣Echo智能音箱,4月份,F(xiàn)acebook也宣布推出聊天機(jī)器人Messenger Platform,希望建立一個(gè)對(duì)話式的系統(tǒng),實(shí)現(xiàn)訂餐、下單、獲取資訊等各種各樣的服務(wù)。接著,谷歌在今年5月的I/O大會(huì)上就發(fā)布了Google Home智能音箱。那么,巨頭們?yōu)楹稳绱诵那械牟季种悄苷Z(yǔ)音和聊天類智能硬件呢?在巨頭之外,中國(guó)的諸多創(chuàng)業(yè)公司也開(kāi)始聲勢(shì)漸起。

智能語(yǔ)音和聊天機(jī)器人都有哪些進(jìn)步?

目前聊天機(jī)器人的火爆,從技術(shù)角度看,微軟小娜項(xiàng)目負(fù)責(zé)人閆勃認(rèn)為主要有兩點(diǎn),一是得益于語(yǔ)音識(shí)別的提高,二是創(chuàng)業(yè)企業(yè)對(duì)垂直領(lǐng)域的語(yǔ)義理解技術(shù)的增強(qiáng)。這是做智能語(yǔ)音的企業(yè)從訓(xùn)練上拿到了更多語(yǔ)量,從實(shí)際的硬件產(chǎn)品使用上有了更多的用戶數(shù)據(jù)。

從語(yǔ)音識(shí)別角度看,一些企業(yè)已經(jīng)不僅僅限于識(shí)別文字,已經(jīng)出現(xiàn)了識(shí)別語(yǔ)調(diào)甚至定制人的聲音。據(jù)國(guó)內(nèi)創(chuàng)業(yè)企業(yè)思必馳CMO龍夢(mèng)竹介紹,思必馳已經(jīng)能夠做到只需通過(guò)很短時(shí)間的訓(xùn)練數(shù)據(jù),比如20分鐘或半小時(shí),就能做出定制人的聲音。當(dāng)然,因?yàn)橛?xùn)練素材的問(wèn)題,所以它的還原度沒(méi)有那么高,不會(huì)像剛才的童音和名人聲音那么真實(shí),但至少能聽(tīng)出這個(gè)人的屬性,讓未來(lái)的聲音可以定制化。

而在語(yǔ)義理解上,出門問(wèn)問(wèn)NLP工程師李理稱,出門問(wèn)問(wèn)在語(yǔ)義分析做了很多事情,一是問(wèn)答系統(tǒng),包括回答垂直領(lǐng)域的問(wèn)答。比如對(duì)60多家服務(wù)提供查詢,比如查天氣、查周圍餐館、講笑話、切換歌曲和導(dǎo)航。另一個(gè)是通用領(lǐng)域的問(wèn)答,比如“劉德華的老婆是誰(shuí)?”“北京有多少人口?”等等。目前,出門問(wèn)問(wèn)已經(jīng)針對(duì)不同場(chǎng)景和服務(wù)做了多輪對(duì)話業(yè)務(wù),比如訂餐、訂咖啡、打車、手機(jī)充值,包括訂票、送貨、上門服務(wù)等。

從產(chǎn)業(yè)的角度看,云知聲CTO梁家恩認(rèn)為,聊天機(jī)器人的火爆是因?yàn)槿斯ぶ悄芤呀?jīng)進(jìn)入產(chǎn)業(yè)化階段。在產(chǎn)業(yè)化的過(guò)程中,感知、認(rèn)知和通用智能是三個(gè)不斷深化發(fā)展的過(guò)程。目前市場(chǎng)正處于從感知到認(rèn)知的變化過(guò)程。感知過(guò)程主要是從信號(hào)到符合辨識(shí)的問(wèn)題,以前機(jī)器智能只能接受確定性符號(hào),對(duì)于圖像、語(yǔ)音這種變化性比較大的符號(hào)是沒(méi)辦法解決的?,F(xiàn)在隨著深度學(xué)習(xí)的推動(dòng)個(gè),不管是語(yǔ)音還是圖像都取得了大的突破性進(jìn)展,包括深度學(xué)習(xí)也在自動(dòng)駕駛方面起到了非常好的結(jié)果。

智能語(yǔ)音是不是下一個(gè)互聯(lián)網(wǎng)入口?

PC時(shí)代,瀏覽器成為了互聯(lián)網(wǎng)的一道入口;到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,以App Store為代表各類應(yīng)用商店成為了入口。而到了IOT(物聯(lián)網(wǎng))的時(shí)代,人工智能助手可能會(huì)成為入口。ROOBO CTO雷宇認(rèn)為,從入口上可以看到用戶界面的交互方式,最早看到的是Web,然后是App,到了新時(shí)代可能是自然語(yǔ)言。

海知智能CEO謝殿俠也認(rèn)為,從鍵盤、鼠標(biāo)到觸摸屏、再到語(yǔ)音交互或者說(shuō)自然語(yǔ)言交互,這實(shí)際上是三個(gè)時(shí)代的變革。實(shí)際上,作為業(yè)內(nèi)很少露面的公司,海知智能的業(yè)務(wù)主要還是向開(kāi)發(fā)者提供語(yǔ)義API接口,幫助開(kāi)發(fā)產(chǎn)品。謝殿俠預(yù)計(jì),到2020年人人事事物物都有自己的bot,就像皇帝有”三宮六院七十二妃“一樣,達(dá)到需求的爆發(fā)。

關(guān)于智能語(yǔ)音與互聯(lián)網(wǎng)相結(jié)合的未來(lái)的發(fā)展路徑,雷宇稱,現(xiàn)在所謂聊天機(jī)器人和Bot的基本框架,簡(jiǎn)單來(lái)講它首先有一個(gè)載體。對(duì)于軟件機(jī)器人,肯定是有超級(jí)App,F(xiàn)acebook在上面的野心是非常大的。包括騰訊的微信,從某種意義上,微信公眾號(hào)也可以認(rèn)為是機(jī)器人,只不過(guò)這個(gè)機(jī)器人和聊天系統(tǒng)比較隔離。之后一定會(huì)有智能助手出現(xiàn),這是它的體現(xiàn)形式。然后后面是有很好的Bot Framework,微軟在這方面做得不錯(cuò)。最后還有一個(gè)服務(wù)方,因?yàn)橐粋€(gè)企業(yè)不可能解決所有服務(wù),因?yàn)橛脩糇罱K還是要它。

聊天機(jī)器人目前的發(fā)展瓶頸到底是什么?

然而,雖然以智能語(yǔ)音為基礎(chǔ)的聊天機(jī)器人在近期獲得了很大的發(fā)展,市場(chǎng)上也推出了一大批聊天類機(jī)器人。但是,這些機(jī)器人和智能語(yǔ)音技術(shù)仍然面臨語(yǔ)義理解不準(zhǔn)確、用戶黏性不強(qiáng)等問(wèn)題。謝殿俠在沙龍上一針見(jiàn)血的指出,語(yǔ)言是思維的一種表述,語(yǔ)言本身有多樣性,也有多義性,你怎么能夠用現(xiàn)在二進(jìn)制的計(jì)算機(jī)來(lái)理解多樣性和多義性的語(yǔ)言呢?

云知聲CTO梁家恩認(rèn)為,聊天機(jī)器人面臨的困難是不斷的進(jìn)行學(xué)習(xí),而在機(jī)器學(xué)習(xí)方面面臨的最大困難就是缺乏一個(gè)穩(wěn)定性泛化能力。通俗的說(shuō),就是我們?cè)趯?shí)驗(yàn)室用得很好,在現(xiàn)實(shí)的復(fù)雜環(huán)境中卻很難用起來(lái)。雖然目前的聊天機(jī)器人和特定的服務(wù)結(jié)合后獲得了一些發(fā)展,但是如何解決隨著數(shù)據(jù)積累越學(xué)越聰明,現(xiàn)在整個(gè)業(yè)界還沒(méi)有特別好的機(jī)制和辦法做這個(gè)工作。

龍夢(mèng)竹認(rèn)為,聊天機(jī)器人的最大瓶頸是缺乏人機(jī)交互,它的外觀做得再漂亮,也不過(guò)是一個(gè)玩具。龍夢(mèng)竹還稱,我們?cè)跈C(jī)器人里遇到的最大障礙就是遠(yuǎn)場(chǎng)交互的問(wèn)題?,F(xiàn)場(chǎng)很多廠商只能做到5米內(nèi)的聲源定位。

至于如何解決聊天機(jī)器人面臨的困境,謝殿俠認(rèn)為,智能語(yǔ)音這塊要突破,第一還需要巨大的數(shù)據(jù)、好的算法,甚至可能牽涉到現(xiàn)在計(jì)算機(jī)的結(jié)構(gòu),另外知識(shí)圖譜也是很大的挑戰(zhàn)。閆勃認(rèn)為,關(guān)于人工智能發(fā)展有幾個(gè)絕對(duì)因素,一是核心產(chǎn)品,二是生態(tài)性,只有產(chǎn)品落地,才能反哺整個(gè)技術(shù)在產(chǎn)品層面的再發(fā)展。

哪些語(yǔ)音交互場(chǎng)景最具增長(zhǎng)潛力?

智能語(yǔ)音技術(shù)和聊天機(jī)器人得到了較大程度的提升,但又面臨一些問(wèn)題。面向未來(lái),創(chuàng)業(yè)企業(yè)該如何發(fā)展?哪些語(yǔ)音交互場(chǎng)景會(huì)成為最具潛力的市場(chǎng)?

關(guān)于智能語(yǔ)音交互的未來(lái)場(chǎng)景,沙龍嘉賓都表示,智能語(yǔ)音的技術(shù)應(yīng)用應(yīng)該集中在垂直領(lǐng)域上,例如小孩和老人。閆勃提醒到,智能語(yǔ)音的市場(chǎng)突破一定要有特定的人群、特定場(chǎng)景來(lái)體現(xiàn)。在具體場(chǎng)景上,雷宇認(rèn)為,有潛力的使用場(chǎng)景是客服以及功能、助理類的場(chǎng)景。感情機(jī)器人和閑聊還有很長(zhǎng)的路要走。龍夢(mèng)竹則認(rèn)為,智能語(yǔ)音目前被看好的交互場(chǎng)景應(yīng)該是車載。這是因?yàn)榧彝サ膱?chǎng)景太復(fù)雜,還需要數(shù)年的進(jìn)步,但車載對(duì)于語(yǔ)音控制和對(duì)話是剛需。

謝殿俠稱,目前智能語(yǔ)音技術(shù)應(yīng)用的關(guān)鍵有三點(diǎn),一是找到用戶的痛點(diǎn),落地到具體的產(chǎn)品。二是讓機(jī)器人能懂得每句話的意思,理解準(zhǔn)確。三是發(fā)展用戶量。謝殿俠認(rèn)為,從具體的能夠突破的用戶場(chǎng)景上,家庭里的智能音箱類產(chǎn)品會(huì)起來(lái)。第二塊是出行領(lǐng)域,比如車載控制和對(duì)話會(huì)逐漸火熱。第三塊是辦公領(lǐng)域,將會(huì)有各種各樣專業(yè)的知識(shí)工作者會(huì)在或大或小的程度被簡(jiǎn)化或者被替代。

從產(chǎn)業(yè)鏈的角度看,不同于其他幾家通過(guò)豐富的服務(wù)把信息查詢到信息服務(wù)打成閉環(huán)的模式,出門問(wèn)問(wèn)的思路是做一個(gè)領(lǐng)域必須要從硬件、軟件、操作系統(tǒng)各個(gè)環(huán)節(jié)都能深度定制,他們認(rèn)為只有這樣才能帶給用戶最好的體驗(yàn)。

放眼更遠(yuǎn)的未來(lái),閆勃認(rèn)為,人工智能下一階段的發(fā)展,在電影作品、文學(xué)作品里,第一部最突出意義上的感情交流就是《HER》這部電影,主人公和人工智能(虛擬人)之間產(chǎn)生了情感交流。閆勃稱,微軟也會(huì)大力提倡“情感交流”的概念,這樣才能讓智能語(yǔ)音真正走近一個(gè)爆發(fā)點(diǎn)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version