科大訊飛很著急。
急著拼命去解釋。
自9月21日被曝出在 2018 創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會議上所使用的“智能翻譯”涉嫌造假,不是AI同傳而是后臺兩位真人同傳譯員臨場實時翻譯后,深陷“造假”漩渦的科大訊飛前前后后出面解釋了五六次。
9月21日當(dāng)天下午科大訊飛公關(guān)就媒體質(zhì)疑緊急做出回應(yīng);當(dāng)晚,科大訊飛公司董秘、副總裁江濤組織召開電話媒體交流會;9月22日,董事長劉慶峰就此事接受媒體采訪;9月24日消費者BG副總裁、聽見科技總經(jīng)理王瑋與爆料者Bell Wang電話解釋溝通;9月25,科大訊飛公眾號發(fā)表了題為《真金不怕火煉 我們沒有造假》的文章;9月27日,科大訊飛還將在上海舉辦線下溝通會。
每一次科大訊飛出面解釋,其實都可以用一句話總結(jié):我們沒有造假。
如此積極的科大訊飛,最后都收到了來自爆料人Bell Wang的和解,表示此事只是工作人員溝通不暢導(dǎo)致的一場誤會——可大多數(shù)旁觀者仍然不買賬。
越來越多的同傳從業(yè)者站出來指責(zé)科大訊飛不是初犯;網(wǎng)友將“造假”的怒火遷移至“訊飛聽見”夸大宣傳、打擦邊球;9月25日首日開盤后訊飛股票當(dāng)即大跌6.2%。
科大訊飛這下更著急了。
心急的行業(yè)
科大訊飛覺得自己很冤枉,明明從來沒有說過“AI代替人類同傳”這句話,卻硬生生被扣上了“造假”的帽子,拖進(jìn)輿論風(fēng)暴的中心。
人工智能行業(yè)早已習(xí)慣了這種噱頭大于實質(zhì)的炒作,“AI威脅論”、“AI替代論”的存在并不是一朝一夕了。
今年4月15日,李迅雷曾說,“博鰲論壇的同聲傳譯是機器翻譯,而且準(zhǔn)確率非常高,如果繼續(xù)發(fā)展,人工同傳都要失業(yè)了。”;16年底,李彥宏在世界互聯(lián)網(wǎng)大會上表示,“未來的若干年,我們很容易想象語言的障礙會完全被打破,現(xiàn)在做同聲翻譯的人可能將來就沒有工作了。”;前中國移動董事長王建宙早在2013年就“預(yù)言”同聲傳譯業(yè)過不了多久就會消失。
愿景說多了就認(rèn)成了現(xiàn)實,整個行業(yè)都會被自我催眠。各公司的產(chǎn)品宣傳稿上常會放出讓同傳下崗的狠話,包括騰訊和微軟這樣具有世界級影響力的巨頭企業(yè)。
李開復(fù)在今年三月《我不是李開復(fù),我是人工智能》的演講中提到,“語音識別是所有技術(shù)里面最不成熟的,當(dāng)我看到一個一個的計劃非常擔(dān)憂,99%會死掉。你們不要看科大迅飛說懂得語音了,他一點不懂。”
話糙理不糙,語音識別技術(shù)和語音理解的發(fā)展技術(shù)遠(yuǎn)不到成熟,經(jīng)常被戲弄為“人工智障”。Speech-to-text都會還時而出現(xiàn)翻車,比如騰訊同傳在今年的博鰲亞洲論壇第一次亮相就把“One Belt One Road”(一帶一路)翻譯成“一條腰帶和一條公路”。Speech-to-meaning就更青澀了,比如不太能聽懂人話的蘋果Siri、微軟小冰。
目前的人工智能翻譯能專注做好于一個領(lǐng)域就已經(jīng)很不錯了,像科大訊飛、搜狗、獵豹移動等公司推出的toC產(chǎn)品移動翻譯機,也僅僅只能適用于基礎(chǔ)常用旅游場景,跨行業(yè)的自然語音理解根本還沒有出現(xiàn)。許多語音公司都在吹捧的“我們的語音識別率已經(jīng)達(dá)到95%以上”,這還不包括離話筒太遠(yuǎn)麥克風(fēng)拾音困難、普通話不標(biāo)準(zhǔn)、環(huán)境噪音過大而出現(xiàn)的失敗案例。
不過“人工智能”這四個字都被寫進(jìn)了政府工作報告,“人工智能”大爆發(fā)的當(dāng)下,大量資本涌入行業(yè)。資本不會考慮技術(shù)是否成熟只想快速看到回報;企業(yè)不管是頭部還是初創(chuàng)公司,都想在規(guī)模與秩序洗牌時涌入前列;行業(yè)也需要通過商業(yè)落地打破公眾質(zhì)疑證明這不只是PPT。每個人都在為“浮夸風(fēng)”添柴加火,就這樣將一門慢生意送上快車道。
逼急的訊飛
可科大訊飛董事長劉慶峰確實沒有撒謊。
過去一年里,劉慶峰但凡在演講中提到“AI翻譯”都會提到一句”人工智能要走下神壇,AI不能代替人類同傳”。不過這些話,被選擇性地忽視,淹沒在了那些更能吸引眼球的“AI威脅論”中。
“現(xiàn)在訊飛的翻譯機達(dá)到的水平是大學(xué)英語六級,訊飛一直所努力的,是希望通過語音轉(zhuǎn)寫和翻譯技術(shù)幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,并不是去替代同聲傳譯。我們的翻譯機能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的信、達(dá)、雅還存在很大的差距。”劉慶峰在2017年7月如此說到,這段話也被寫進(jìn)了科大訊飛這幾天來的回應(yīng)當(dāng)中。
科大訊飛沒有“主動造假”,但卻用隨意、模糊、歧義的措辭用于產(chǎn)品包裝與宣傳,“試圖造假”。
以這次的直播宣傳文案來看,只粗淺地寫到“訊飛聽見”利用科大訊飛的語音技術(shù)實現(xiàn)“智能翻譯”,并沒有坦率地直面“翻譯部分主要由同傳譯員完成”,“訊飛聽見”其實只負(fù)責(zé)翻譯語音識別進(jìn)行文字轉(zhuǎn)換。躲閃的態(tài)度不該是一個想要撐起千億市值的AI領(lǐng)域“國家隊”該有的表現(xiàn)。
科大訊飛深耕了20年語音技術(shù),作為中國最大的語音識別人工智能公司,產(chǎn)品占據(jù)中文語音識別服務(wù)市場70%的份額,是繼BAT后第四大國家科技與創(chuàng)新開放平臺,多次斬獲國際語音識別類比賽一等獎。在整個語音識別人工智能發(fā)展態(tài)勢如火如荼的當(dāng)下,領(lǐng)頭羊科大訊飛承認(rèn)自己的AI翻譯聽不懂,面子上真的掛不住。
于是,科大訊飛拿出了具備技術(shù)門檻的專業(yè)詞匯“人機耦合”來針對造假風(fēng)波進(jìn)行反駁。表明這種直接轉(zhuǎn)寫同傳語音作為“人機耦合”的方式,可以降低同傳工作者工作強度、賦能翻譯人員,并在聲明中特別強調(diào):人機耦合才是未來。大多數(shù)人根本看不懂“人機耦合”這四個字是什么意思,也就喪失了指責(zé)的權(quán)利。
簡單來說,“人機耦合”是指人和機器一個輸入、一個輸出,達(dá)到一種人和機器響應(yīng)共振的工作狀態(tài)。難道徹底取代同傳就不屬于“人機耦合”的目標(biāo)了嗎?科大訊飛沒有給出答案。
這種說法,既不能讓沒有減輕工作量的同傳譯員滿意,也無法化解大眾心中的疑惑,但至少可以讓批評者暫時性失語,盡最大可能名譽的損害降到最低。
窘急的財報
科大訊飛確實受不了任何對于名譽的打擊。
三個月前,科大訊飛剛剛經(jīng)歷過一次投資人質(zhì)疑。二季度財報發(fā)布前科大訊飛高調(diào)宣布訊飛輸入法的用戶已突破6億。結(jié)果根據(jù)第三方咨詢公司BDR的統(tǒng)計,截止今年一季度我國輸入法市場活躍用戶一共只有6.3億,而訊飛輸入法在國內(nèi)輸入法市場所占的市場份額只有8.7%。
事發(fā)的6月22日當(dāng)天收盤后,科大訊飛以13.12%的周跌幅創(chuàng)一年來新低。
作為人工智能第一明星股,科大訊飛曾經(jīng)市值破千億,而現(xiàn)在總市值只有600億,繼續(xù)下跌市值只有腰斬。
眾所周知,科大訊飛是一家低利潤公司,2016年、2017年凈利潤分別為4.84億、4.35億,今年上半年凈利潤1.36億,這其中還有1/4來自政府補貼,2016年補貼1.67億,2017年補貼1.8億。
而科大訊飛很大一部分利潤是來自教育業(yè)務(wù),可教育行業(yè)的收入本身就靠政府補貼維系。
靠天吃飯的盈利模式必然不是長久之策,它把思路轉(zhuǎn)向了消費端,推出訊飛翻譯機及訊飛翻譯機2.0。不過語音識別技術(shù)本身門檻較低,與市面上常見的準(zhǔn)兒go、搜狗翻譯寶等翻譯機產(chǎn)品相比,從技術(shù)層面基本拉不開差距。而且翻譯機應(yīng)用場景單一,僅限于旅游,售價高達(dá)2999元,加上移動Wi-Fi向翻譯機功能迭代、手機軟件翻譯能力日趨強大,這些都成為制約科大訊飛C端產(chǎn)品規(guī)?;侀_的掣肘。
科大訊飛執(zhí)行總裁胡郁曾說,語音交互技術(shù)要做出殺手級應(yīng)用或產(chǎn)品,一定是有個性化的、多樣性的產(chǎn)品。不過究竟是怎樣的產(chǎn)品類型,他自己還沒有想到。
技術(shù)面、產(chǎn)品面都拉不開差距。能真正區(qū)分語音技術(shù)公司的決勝砝碼,是數(shù)據(jù)。
在這方面,科大訊飛作為先行者有多年來積累的語料庫進(jìn)行機器學(xué)習(xí)和數(shù)據(jù)訓(xùn)練。不過要看到的是,競爭對手手握的是比科大訊飛更大的數(shù)據(jù)源:騰訊有微信語音、搜狗有輸入法、阿里有天貓精靈,此外還有深耕車載的云知聲、思必馳,語音生活搜索的出門問問等。
再回頭看,沒有得天獨厚的場景作數(shù)據(jù)來源支撐,科大訊飛成了最好捏的軟柿子。
不過,目前做語音識別人工智能企業(yè),目前還沒有一家能夠盈利,仍處在大規(guī)模燒錢培育市場的發(fā)展初期。
不必太急,留給科大訊飛的還有時間。