ITBear旗下自媒體矩陣:

不要高估AI技術(shù),忽悠大眾誤國誤民

   時間:2017-01-19 13:56:39 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

過去一兩年來,人工智能的火熱有目共睹。從學(xué)界到業(yè)界,從創(chuàng)業(yè)者到投資人,關(guān)于AI即將爆發(fā)的論調(diào)層出不窮。與此同時,AI領(lǐng)域創(chuàng)業(yè)公司的估值也水漲船高,高估值承載的是創(chuàng)業(yè)者和投資人對于AI和公司發(fā)展前景的樂觀預(yù)期。但是這種高預(yù)期背后,是否有足夠強有力的邏輯作為支撐?很多已經(jīng)“進入”的投資人甚至說不出個所以然來。

臨近年底,一些投資人開始為AI“降溫”,引導(dǎo)行業(yè)冷靜看待當(dāng)前的AI技術(shù)和商業(yè)化應(yīng)用。如果投資人的觀點還不足以服眾,那么在AI領(lǐng)域奮戰(zhàn)20多年的行業(yè)前輩,或許能從技術(shù)角度給我們一些更現(xiàn)實的啟示。

近期,愛分析對捷通華聲董事長張連毅進行了訪談,探討了他關(guān)于當(dāng)前人工智能各項技術(shù)的發(fā)展水平和行業(yè)應(yīng)用現(xiàn)狀、以及對接下來全行業(yè)發(fā)展態(tài)勢的看法。

圖:捷通華聲董事長張連毅

張連毅1989年畢業(yè)于清華大學(xué),從1990年開始致力于將清華的OCR技術(shù)商業(yè)化。2000年,他和清華大學(xué)陳明博士與中科院聲學(xué)所研究員呂士楠共同創(chuàng)建捷通華聲,主要提供語音合成技術(shù)。2016年,捷通華聲正式登陸新三板。

如今,這家有著17年歷史的公司已經(jīng)構(gòu)建了涵蓋語音識別、語音合成、聲紋識別、語義理解、OCR、手寫識別、人臉識別、指紋識別、機器翻譯、數(shù)據(jù)挖掘等十項技術(shù)的全方位人工智能平臺,為包括金融、電信、能源、交通、教育、醫(yī)療、政府、汽車、IT互聯(lián)網(wǎng)等眾多行業(yè)客戶提供AI技術(shù)和解決方案。(詳見愛分析文章《AI格局3年定型,捷通華聲能否成為十項全能冠軍? | 公司調(diào)研》)

張連毅認為,包括語音、圖像識別、語義理解等在內(nèi)的人工智能技術(shù)尚不完美,是全社會對AI技術(shù)接受度的提高帶動了各項技術(shù)商業(yè)化需求的猛增。然而,一些公司及行業(yè)人士對AI技術(shù)宣傳過度,其實是在誤導(dǎo)大眾。這種誤導(dǎo),將不利于AI技術(shù)未來的發(fā)展和應(yīng)用。此外他還指出,從2011年到2016年上半年是AI技術(shù)啟蒙的5年,而接下來的3-5年,則是AI產(chǎn)業(yè)格局的定型階段。

愛分析節(jié)選部分精彩內(nèi)容,與您分享。

AI技術(shù)尚不完美,應(yīng)用和商業(yè)化要看行業(yè)要求

Q:OCR屬于人工智能技術(shù)嗎?

A:以前人工智能和人機交互是分開講的,現(xiàn)在合起來了。我認為人工智能可以理解為兩個層次,人機交互是淺層次,讓機器像人一樣能看會聽,而讓機器具備像人一樣的思維和推理能力,是深層次。OCR屬于圖像識別領(lǐng)域一項比較傳統(tǒng)的技術(shù),它屬于人機交互,是淺層次的人工智能。

當(dāng)然,雖然它較為傳統(tǒng),但也不是完全成熟,也是近幾年隨著深度學(xué)習(xí)技術(shù)的發(fā)展才取得了一些突破,對于模糊、壓線、重疊、有背景色等情況下的識別準(zhǔn)確率有了顯著提升。另外從開發(fā)者的需求來看,各行各業(yè)對OCR技術(shù)的需求仍然非常旺盛,包括藥瓶上的文字識別、票據(jù)識別、物流行業(yè)的快遞單識別等等。所以O(shè)CR技術(shù)是人工智能領(lǐng)域一項行業(yè)需求正旺的傳統(tǒng)技術(shù)。

Q:國內(nèi)有哪些做OCR技術(shù)的源頭?

A:OCR技術(shù)90年開始興起,主要源頭就是清華(以捷通華聲、文通為代表)、中科院(以漢王科技為代表)、摩托羅拉(以上海合合信息為代表),以及新加坡國立研究院,國內(nèi)也有兩家代表企業(yè)。

Q:現(xiàn)在圖像和語音識別還需要人工校對嗎?

A:都需要。外界的一些近乎100%準(zhǔn)確率的語音識別演示,其實是經(jīng)過了專門訓(xùn)練的,實際使用場景下不會有那么高的準(zhǔn)確率。當(dāng)然各行各業(yè)對語音識別效果的要求不一樣,比如醫(yī)療、法律等領(lǐng)域是不允許出現(xiàn)錯誤的,那么技術(shù)公司要么在后方設(shè)呼叫中心,進行人工校對,比如Nuance就有一個幾千人的團隊在做校對工作,要么就是加強專門的數(shù)據(jù)訓(xùn)練,來降低錯誤率,在實際使用中,對于部分小錯誤,再讓用戶進行自主校對。

Q:現(xiàn)在行業(yè)內(nèi)語音識別準(zhǔn)確率基本在什么水平?

A:手機APP和電話信道分別是16K和8K聲道,現(xiàn)在手機APP的16K聲道識別率基本都在95%左右,8K電話信道識別率最高只有85%,當(dāng)然之前才60-70%。

Q:聲紋識別現(xiàn)在有哪些難點?

A:單一聲道聲紋識別還可以,但是跨聲道的聲紋識別還不行,比如從電話信道到手機,從手機到麥克風(fēng)等,就很難識別。

Q:如何看待當(dāng)前的人臉識別技術(shù)和市場?

A:我理解,人臉識別的技術(shù)要求是跟行業(yè)應(yīng)用掛鉤的?,F(xiàn)在很多創(chuàng)業(yè)公司都把人臉識別用在金融、安防領(lǐng)域。如果用在公司考勤,98%以上的識別準(zhǔn)確率足夠了,但如果用在金融領(lǐng)域,比如刷臉支付,就算做到99.99%,還是會有0.01%的誤差。

所以我認為,人工智能在金融領(lǐng)域的應(yīng)用,單一技術(shù)有難以承受的風(fēng)險,技術(shù)無法保證100%正確,只有通過多項技術(shù)融合,多重驗證,才能保證萬無一失?,F(xiàn)在生物特征識別的準(zhǔn)確率相比模式識別并不是很高,只有虹膜識別是最高的,所以捷通會把聲紋、人臉、指紋、證照識別一起用上。

Q:人臉識別技術(shù)目前有哪些難點?

A:人臉識別最大的難點是光線,光太強、太暗都無法保證很好的識別效果。技術(shù)再先進也還是會受到環(huán)境因素的影響。就像清華的張鈸院士一直不看好無人車,因為無人車主要靠視覺,在天黑、刮風(fēng)下雨、霧霾等條件下視覺會受到很大限制。

Q:您怎么看待無人車?

A:當(dāng)然現(xiàn)在無人車很熱,我個人認為無人車在一些特定領(lǐng)域,比如無人軌道,就是在某段路開,不允許有人,這是可以的。但是要在日常的大馬路上開,除了前面提到的攝像頭視覺方案會遇到的問題以外,還有人、物、景的鑒別問題。之前特斯拉出事故,至少說明在某些情況下無人車還是不能很好地識別物體和環(huán)境狀況。另外,交通事故的責(zé)任界定也是一個很大的問題。

當(dāng)然行業(yè)內(nèi)現(xiàn)在會采用一些多傳感器融合的方案來減少視覺方面的限制,但是我想說,我們?yōu)槭裁匆欢ㄒ匀说纳鳛榇鷥r?無論是車?yán)锏娜?,還是車外的人。我們還不至于依靠技術(shù)實現(xiàn)便捷而用自己的生命作為賭價。

Q:行業(yè)內(nèi)還有一個觀點,沒有無人駕駛,同樣還是有很高的事故發(fā)生率,無人駕駛成熟以后還是能夠在一定程度上提高安全性的,您怎么看待這種觀點?

A:技術(shù)成熟以后提高安全性是沒錯的,但是人的事故責(zé)任是比較容易界定的,而無人車的話是不容易界定的,它的風(fēng)險是不可預(yù)測的,人的風(fēng)險是可以預(yù)測的。當(dāng)然無人車作為一種技術(shù)追求還是值得去研究和探索的,可能真的有一天會實現(xiàn),但是我認為還是比較遠的,除了車上的傳感器,相關(guān)的配套基礎(chǔ)設(shè)施也得跟上,這個還是需要時間,目前可預(yù)見的技術(shù)確實還達不到。

AI火熱得益于行業(yè)接受度提高,未來3-5年AI格局將定型

Q:對人工智能的發(fā)展階段怎么看?

A:捷通是2011年7月轉(zhuǎn)的型,到2016年6月正好是一個完整的5年。

我認為人工智能的產(chǎn)業(yè)發(fā)展有兩個階段,2016年6月之前的5年是啟蒙階段。這5年里面的玩家,基本上都是以前做這個行當(dāng)?shù)钠髽I(yè),比如捷通華聲、云知聲、思必馳、曠視、商湯、小i機器人、海鑫科金、得意音通、中科信利,上市公司有科大訊飛、漢王科技。

進入到2016年下半年,百度、騰訊、阿里、搜狗、華為等“航母”也開進來了,人工智能真正的戰(zhàn)役才開始。所以這之后的5年,是產(chǎn)業(yè)格局逐漸成型的階段。目前大部分客戶都是抱著試一試的心態(tài),而不是真正在使用技術(shù),所以現(xiàn)在很多單一領(lǐng)域的需求很分散,還沒有形成剛需。接下來的兩三年內(nèi),產(chǎn)業(yè)格局就會逐漸形成,四年之后格局就會慢慢定下來。

到時候,人工智能一定會出類似BAT一樣的巨頭,因為時勢造英雄。

Q:是否認為當(dāng)前人工智能過熱?

A:確實過熱。這個產(chǎn)業(yè)確實在崛起,所以不能過低估計整個產(chǎn)業(yè),但是也不能過高估計它的技術(shù)。人工智能技術(shù)的發(fā)展,不是得益于大家所看到的語音識別95%、97%的識別準(zhǔn)確率,而是得益于整個社會對人工智能的理解和包容。

原來人們對人工智能的態(tài)度是,錯一個字都不滿意,我說話你就得能聽懂。但是這些年慢慢發(fā)展下來,人們發(fā)現(xiàn)雖然有錯字,但是我可以包容和嘗試了,你試試語音,他試試圖像,所以現(xiàn)在需求蜂擁而至。正是這種包容極大地促進了人工智能技術(shù)的應(yīng)用。

當(dāng)然這種包容和嘗試還是更多的在商業(yè)領(lǐng)域。一些語音公司最開始做2C產(chǎn)品,實際上剛出來的時候熱幾天,之后就沒人用了。相比之下,把語音技術(shù)用在智能客服領(lǐng)域是一個比較正確的方向。從現(xiàn)階段來看,垂直領(lǐng)域的商業(yè)化會走得更快一些。

Q:如何看待當(dāng)前一些人工智能會戰(zhàn)勝和取代人類的說法?

A:Alpha Go贏了之后,有人問我人工智能會不會戰(zhàn)勝人類,我認為這個問題要看機器戰(zhàn)勝人類的什么。如果說在某些方面的話,那么在計算器誕生以后,機器就已經(jīng)戰(zhàn)勝人類了。

不管別人怎么說,我理解,人工智能是人類的伙伴,它的誕生是為了幫助人類,成為人類的助手。它不是不可能取代人類,但有一個前提,我們?nèi)祟惸懿荒芟雀忝靼孜覀兊纳喜∷朗窃趺椿厥?

人工智能是仿人,人類之所以能把撞得很破的汽車復(fù)原,是因為人精通汽車的整體構(gòu)造,但是人類對自身大腦的了解少之又少,而AI的核心又恰恰是在大腦,所以要造出一個超越人類的AI起碼是建立在人類對自身有足夠了解的基礎(chǔ)上。

人工智能未來的發(fā)展一定是伴隨著人類對自身的理解不斷加深,等到這種理解達到一定程度,我們才能去談人工智能能否戰(zhàn)勝人類?,F(xiàn)在討論這個問題還為時過早,現(xiàn)在我們更應(yīng)該關(guān)注的是這些技術(shù)怎么來服務(wù)行業(yè)、服務(wù)社會大眾,減輕工作負擔(dān)和壓力、提高工作效率、降低成本,同時給大眾帶來一些娛樂和便捷。

Q:如何看待讓人工智能參加高考并考上一本這個項目?

A:這其實是我最不認同的一件事情。

中國的父母有兩個心病,一個擔(dān)心家人生病,一個是擔(dān)心子女教育。中國的教育是固化的填鴨式教育,毫不夸張地說,就是摧殘兒童。真正的教育應(yīng)該是啟蒙式的,引導(dǎo)你去發(fā)現(xiàn)事物的本質(zhì)。而我們是灌輸式的僵化教育。

讓人工智能參加高考并不能證明什么,就算幾年以后人工智能參加高考成功了,也只能證明一件事,中國的考題式教育已經(jīng)到了無以復(fù)加的地步。因為不管是答題,還是寫作文,從技術(shù)上看并不難,只要把海量的題庫拿過來,讓機器去學(xué)習(xí)、訓(xùn)練就行了。這個過程并沒有創(chuàng)造什么,并沒有對中國的教育進行一些有益的改變。

所以我們的企業(yè)可以去探索人工智能的應(yīng)用方向,比如幫助孩子寫寫字、練練普通話和英語口語,那是可以的,但是不要夸大它在教育領(lǐng)域的應(yīng)用。企業(yè)一定要服務(wù)行業(yè),而不能誤導(dǎo)行業(yè),因為這種誤導(dǎo)是誤國誤民的。

Q:如何看待當(dāng)前AI類公司的高估值?

A:首先需要肯定這個領(lǐng)域還是有一些很優(yōu)秀的公司存在。

但是從技術(shù)角度講,這個領(lǐng)域的門檻并沒有想象中那么高。很多公司都是基于國外的開源技術(shù)在做,原創(chuàng)技術(shù)并不多。既然是開源的,大家都可以學(xué),并不是說誰就有很高的門檻。比如這兩三年,國內(nèi)就冒出了很多做語音的公司。

所以目前的高估值一方面是因為這個市場真的起來了,另一方面不排除有一些包裝的成分在里面。

我向來不相信獨角獸,因為人工智能包含各種各樣的技術(shù),單靠一項技術(shù)是不可能壟斷的。這是一個風(fēng)起云涌的時代,創(chuàng)新會一直持續(xù)下去。企業(yè)當(dāng)然還是要構(gòu)建核心技術(shù),但是想依靠核心技術(shù)壟斷行業(yè)是不太可能的。

人工智能企業(yè)還是要本著開放、共享的心態(tài)來做。一家人工智能公司能否實現(xiàn)長遠發(fā)展,關(guān)鍵在于能否正確理解人工智能,而不在于單一技術(shù)的領(lǐng)先。如果不能正確理解人工智能,也許可以活著,但是能走多遠能爬多高,可能就是一個問號。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version