“重倉”人工智能,是李開復(fù)和創(chuàng)新工場未來幾年的方向。但是,他面臨一個很重要的問題:現(xiàn)在的 AI 創(chuàng)業(yè),核心是 AI 科學家,而“文能起筆安天下,武能上馬定乾坤”的 AI 科學家鳳毛麟角,用他的話說“該創(chuàng)業(yè)的都創(chuàng)業(yè)了”。
這時,產(chǎn)業(yè)在面臨一步棋。那就是:如何把一個普通的 AI 科學家變成“創(chuàng)業(yè)英雄”。
作為三十年前就開始研究人工智能的李開復(fù),覺得自己“技術(shù)范兒”的創(chuàng)新工場有能力推動這步棋,并且在這一步棋中獲得穩(wěn)固的戰(zhàn)略優(yōu)勢。
李開復(fù)告訴雷鋒網(wǎng),
AI 創(chuàng)業(yè)現(xiàn)在是科學家的天下,之后是數(shù)學家的天下,將來是普通人的天下。
以下是李開復(fù)在《創(chuàng)新工場人工智能戰(zhàn)略白皮書》發(fā)布會上的閉門分享,雷鋒網(wǎng)將其整理成為《李開復(fù):AI 創(chuàng)業(yè)的十個真相》,呈現(xiàn)給讀者。
AI 科學家都是超級宅男
創(chuàng)新工場本身主營的機構(gòu)是投資和投后的機構(gòu),我們當然是看項目,看創(chuàng)始人,他們有 idea、方向,我們就會用基金投資它。
過去的互聯(lián)網(wǎng)創(chuàng)業(yè)模式,已經(jīng)非常經(jīng)典地被《精益創(chuàng)業(yè)》描述:
幾個小朋友隨便做個產(chǎn)品上去,能融資就融資,不能融資就拉倒。怎么樣去惠及用戶,迭代產(chǎn)品,之后變現(xiàn),成為經(jīng)典的模式。
這個創(chuàng)業(yè)的模式,它的紅利時代已經(jīng)過去了。當然以后還會有,但是不會像以前那么多。創(chuàng)業(yè)的門檻大大提高了,因為人工智能是下一批創(chuàng)業(yè)方向,而人工智能創(chuàng)業(yè)里面很核心的人物其實是 AI 科學家, AI 的公司沒有 AI 科學家是沒戲的。
但是AI科學家往往都是超級宅男,自己宅在房間里面,整天做實驗,突然你把他丟到一個殘酷野蠻可怕的世界里,他自己創(chuàng)業(yè)成功率不是很高。
很多 AI 科學家一般這輩子從來沒想過創(chuàng)業(yè),現(xiàn)在突然想創(chuàng)業(yè)了,然后發(fā)現(xiàn)自己長板特別長,短板特別短:
他也許技術(shù)很牛,但是也許執(zhí)行不夠;
也許他的產(chǎn)品演示起來很好,但是一做起來都是Bug;
也可能他產(chǎn)品做得很不錯,但是不懂市場;
或者懂市場但是不知道怎么去賣。
尤其 AI 本身又是一個 ToB 的業(yè)務(wù),所以不是那么容易自己攢一個局。所以 AI 科學家需要懂商業(yè)的人,懂 ToB 的人,他需要工程師。
AI 創(chuàng)業(yè)“不美好”
我們平時都會把 AI 創(chuàng)業(yè)講得很美好,今天我就跟大家講講 AI 不美好的地方。
第一個就是:AI 科學家有短板。
這一點剛才已經(jīng)說了,我們要想怎么幫“宅男”補足短板。
第二個就是:AI 創(chuàng)業(yè)很貴。
剛才講的“精益創(chuàng)業(yè)”很便宜,因為幾個小朋友不拿薪水,用零元就可以把第一個 App 推出去。
我們剛投資一家公司,投了一個月以后錢就用完了。我說你們不就八個人怎么錢就用完了,給了你好幾百萬。但他們說,光買機器就用了三百萬。
第三個就是:AI 需要數(shù)據(jù)。
識別一張圖片,最少需要幾十萬張樣本數(shù)據(jù),甚至幾百上千萬。誰給你弄數(shù)據(jù)?
所以做人工智能投資有一個非常頭大的地方:一下頂尖的人就投完了。
過去這兩年我們就到處去掃,從最厲害的團隊出來的無人駕駛公司投了兩個,沒投兩個。然后就再也找不到團隊了,因為有資格的人就那么多。
我們做互聯(lián)網(wǎng)金融,掃完了以后大概投了三個,然后可能有一兩個錯過了機會,一兩個沒投,然后就沒有了。
因為AI科學家就那么多,能夠創(chuàng)業(yè)把事情打造到一個地步的就那么多。
AI 的現(xiàn)狀是“僧多粥少”。大家都去搶那幾棵樹,已經(jīng)把樹拱到天價了。我覺得 AI 這片土地需要“施肥”,而不是搶那些非常少的農(nóng)作物。
所以我們成立了“人工智能工程院”。我們可能花幾千萬把機器搞定,然后幫助十家二十家創(chuàng)業(yè)公司;我們從各種渠道拿到數(shù)據(jù),AI 科學家可以做試驗;我們試著讓更多有潛力的 AI 科學家,能夠考慮來創(chuàng)業(yè)這條路,幫他們把可能 95% 的失敗率降低到 40%,這樣的話我們就能夠產(chǎn)生自己的價值。
當然,投靠創(chuàng)新工場,我們幫你解決所有問題,也要求自己的回報。本來可能五百萬占股 10%,現(xiàn)在也許給我們 15%,我們覺得這樣的話也就足夠了。以后如果可以打造出獨角獸,我們是有很多回報的。
這個工程院在得到金錢回報的話,至少得花掉兩億元人民幣。但如果是我們施肥的,想必相比那些“農(nóng)作物”會喜歡我們。
兩三年之后,AI 會像 Android 一樣普及
長期來說,真的是永遠只能由 AI 科學家來創(chuàng)業(yè)嗎?其實不一定。
任何技術(shù)都有一條發(fā)展路徑,一個很好的例子就是 Android。當年我們跟 CSDN 的蔣濤一起做移動開發(fā)者的大會。第一次大會的時候,我問現(xiàn)場觀眾:有多少人看好Android?大概有5個手。我問有多少人看好 Symbian?五百個手舉起來。
但當時我們堅決相信 Android 才是未來的道路。只是因為平臺不夠?,F(xiàn)在大學里面的 Android、 iOS 培訓課程非常普及。你如果是一個計算機的學生,你自己自學也好,去做培訓課也好,幾個月之內(nèi)你就可以開始做 Android 了。
AI 也是這樣的狀態(tài)。
要多久時間呢?我們大膽的假設(shè)兩三年吧。這兩三年里,我們工程院孵化科學家會是一個非常獨特而有價值的方法。三年以后平臺出來了,很多聰明的大學生可以自學。平臺、工具越來越多,AI 會變得越來越容易用了。
以后年輕人來創(chuàng)業(yè),我覺得可能比現(xiàn)在的科學家創(chuàng)業(yè)更能成功。因為創(chuàng)業(yè)需要有動機,有狼性,愿意拼命。本來就要把自己名聲,身家全部賭進去的。
有資格的人六個月就能成為 AI 工程師,有資格的人是指:數(shù)學天才
一位老教授,用三十年的功力弄出來一個新算法。這種可能性是存在的。
但真正能發(fā)力的其實還是年輕人。很多年輕人只是苦于沒有一個平臺。
我告訴大家一個秘密。
如果你是一個有資格的年輕人,我們只需要六個月就可以把你培訓成為一個 AI 工程師。絕對不是你想象的二十年,三十年。這不像一個材料科學家、火箭專家——這種專家真的是需要三十年的功力。
那么,什么是有資格呢?
很不幸,不是所有的人。“有資格”簡單來說就是:數(shù)學天才。
當然,這其中也涵蓋了統(tǒng)計、自動化、計算機。中國人口這么多,光是數(shù)學天才我們應(yīng)該一年都要產(chǎn)生個幾十萬了。
假設(shè)有十萬個數(shù)學小天才,那里面對AI有興趣的可能就會有五萬。(因為中國學生是特別愿意去追最熱門的東西,最熱門的定義是什么呢?很酷,能賺很多錢的。)
里面有兩萬個接觸到了一些培訓平臺,花了六個月去做,這兩萬人里可能又有兩千個是適合的領(lǐng)軍人物。比如說他是AI領(lǐng)域的雷軍、傅盛等等這些人。
這兩千人最終才是我們最好的投資對象。我們的工作就是讓這些人出現(xiàn)。
所以短期我們是抓著科學家來,再過三四年我們要把這些年輕人都培訓出來。讓他們認知這是創(chuàng)業(yè)最好的時機。所以這秘密就是:我們要挖掘中國所有的數(shù)學小天才,然后引導他們進入AI創(chuàng)業(yè)。
AI 接管人類?我們的問題是科幻小說看多了
我們應(yīng)該怎樣看待 AI 呢?
有人看到阿法狗戰(zhàn)勝了李世石,瞬間就聯(lián)想到了 AI 要接管人類。實際上,這其中還差十萬八千里。
AI里最難的問題之一,是跨領(lǐng)域的自然語言理解。要做到這一點,需要上下文的理解,需要跨領(lǐng)域的知識,還需要人類的“Common Sense”。
例如我突然和你說:“中午還好沒吃漢堡,麥當勞不好吃。”這句話所有人都明白什么意思,但是機器很難讀懂。它可以把每一個字都識別正確,但仍然無法“理解”。
再例如:熨斗打開的不能去摸,沾了水的手不能碰電。這些東西不用講我們都知道。但是計算機怎么會知道這些事情呢?
你怎么去教一個計算機跨領(lǐng)域的知識?你怎么教會它七情六欲?你怎么教會它什么是美?什么是愛?什么是宗教?什么是信仰?這些東西差得還非常遠。
揣測可能發(fā)生的事情跟確信一定會發(fā)生的事情,這兩個還是要分辨得很清楚的。任何剛才講的 AI 不能做的事情,我們都無法揣測多久會被突破。有人說五年,有人說五十年,也有人說永遠不會。
我覺得我們真正應(yīng)該討論的事情是怎么用AI來創(chuàng)造價值,怎么讓人類能夠沒有饑餓和寒冷,讓每一個人都能有尊嚴的活著。
例如,未來很多藍領(lǐng)和白領(lǐng)的工作都會被取代,也包括了記者。當然有些深度文章機器可能五十年也寫的出來。但是如果你從網(wǎng)上攢一些資料,例如科大訊飛發(fā)布財報,產(chǎn)品多了30%,分析師說股票怎么樣,未來人工智能被看好什么的,這種東西機器已經(jīng)在寫了。
當機器能夠把簡單的工作取代的時候,當經(jīng)過五秒以內(nèi)思考的事情人都不用做的時候,當這么多人將可能失業(yè)的時候,這些失業(yè)者應(yīng)該怎么做?我們?nèi)绾稳ブ匦掠柧毸麄?孩子的教育是什么樣的?怎么讓人類繼續(xù)的去尋找應(yīng)該做的事情?也許造物者是不希望我們做這種無聊的工作,讓我們都做有意義的事情,所以才用機器取代了我們。
剛才講的這些事情都是十年內(nèi)會發(fā)生的。
當然未來也可能是 AI 養(yǎng)活了全世界,我們也許都成為 AI 的寵物,在家里戴著 VR 頭盔玩游戲。機器會不會有自我意識,會不會取代人,會不會成為物種,雖然未必不可能,但這些是未知的。
很不幸的是:我們科幻小說看多了。
“AI 新物種”“取代”“奴役”,這些當然可以被想象,但有更多必然的有意思的問題,更值得我們?nèi)ニ伎肌?/p>
AI “低處的果實”還沒摘完
人工智能有很多學派。符號學派、連接學派等等。但是除了深度學習以外的方法,經(jīng)過多年被驗證,是不太有發(fā)展的。
模擬人的分析方法,希望把它變成一個規(guī)律和專家系統(tǒng),過去五十年已經(jīng)證明了這個思路是不行的。當然也許某一天會有一個突破,但是直到那一天為止應(yīng)該是不行的。
就我自己的背景來說。在1988年,我就開始做語音識別。當年第一套系統(tǒng)就是用完全機器學習的方法來做的非特定人的語音識別。
現(xiàn)在看起來這是一個特別小的方法:世界上有一個人能夠從紙上讀出語音,我的導師就要把這套方法變成一套專家系統(tǒng)。
當年就讓我很堅定地認為:機器的構(gòu)造跟人腦,跟人的思維方式其實是不一樣的。我們硬要把A放到B其實是很困難的,就像我們不能逼自己去變成一個深度學習者,去分析事情——我們腦子思維就不是那樣的,是不自然的。
用腦科學的方法制造人工智能,是一個未知的領(lǐng)域。未知的東西有它的魅力,你要做研究就要做未知,你要有了突破那就是創(chuàng)新。在學術(shù)領(lǐng)域你做每一件事情的衡量標準是:我要做別人從來沒做過的東西。我們可以假設(shè)腦科學跟未來的 AI 是相關(guān)的,我們可以去證明這是或不是。但是從投資的角度來講,押注的風險就太大了。
當年深度學習也是因為數(shù)據(jù)的不足,碰到了一些瓶頸。但近年我們看到有好幾個特別大的變化:
第一個就是特別大量的數(shù)據(jù)在某些領(lǐng)域開始產(chǎn)生,而且我覺得我們目前還沒有被用完。
第二個就是 GPU 的使用讓我們能夠更高效地、非常快速地做深度學習。
現(xiàn)在我覺得,所謂的深度學習的果實還遠遠沒有被摘完。人工智能的應(yīng)用來說百花齊放,一個一個大果實就在你面前。在這種情況下,你還要去種花,何必呢?
我們把 GPU 和海量數(shù)據(jù)在全世界掃一遍,應(yīng)該還夠我們 VC 界吃個五年,所以從投資的角度這是非常清晰的事情。
再往下走,我覺得我們 AI 肯定不可以是只有深度學習。例如現(xiàn)在還有增強學習的方法,也在被探索。AlphaGo 里面也不是只存在一個方法。所以我覺得學術(shù)界其實應(yīng)該開始幫助和探索更多的可能性,當我們把這兩年的糧食吃完之后也許還有更好的機會。
我沒有 AI 宗教信仰
當然未來 AI 也可能沒有進一步的突破了。
如果沒有的話,那就說明 AI 的黃金時代過去了。下面就是物聯(lián)網(wǎng)或者其他什么的。作為投資機構(gòu),我們并沒有一種 AI 宗教信仰,我們還是要把控靈活度。
就像移動互聯(lián)網(wǎng)時代,當時我們應(yīng)該是在業(yè)界最高調(diào)的移動互聯(lián)網(wǎng) VC。但是隨后我們根據(jù)情況做了調(diào)整。
如果學術(shù)界跟產(chǎn)業(yè)界有一個合理的分工,我對未來五年投資界和產(chǎn)生價值非常樂觀,對于所謂AI的泡沫我認為不會發(fā)生。當然有個別的案例會有泡沫,但是我認為能吃的糧食實在是太多了。
學術(shù)跟產(chǎn)業(yè)它的分工大概是這樣:
一方面是一個很天然有機的分工;
另外一方面又是有一點羨慕嫉妒恨在里面。
一般來說學術(shù)界是看不起工業(yè)界的,但是在某一個時刻突然工業(yè)界的一個技術(shù)成熟了,在這個技術(shù)上學術(shù)界就做不到工業(yè)界的成就了。于是學術(shù)界就被逼的去做新的東西。例如:現(xiàn)在再去做人臉識別,學術(shù)界就已經(jīng)打不過工業(yè)界了。所以在人工智能領(lǐng)域,很少見到一個老教授一生只研究一個命題。
AlphaGo 本身沒有商業(yè)價值
AI 會帶給我們什么價值呢?
我想先說說 AlphaGo。之所以 AlphaGo 如此引人注目,很大程度上是因為我們這樣的專家把它講得太懸。
之前我覺得圍棋比國際象棋至少難十年或十五年,但后來結(jié)果證明我是過于悲觀了。我過于悲觀其實有很多理由。我當時認為圍棋要比國際象棋難了一個天文數(shù)字,但天文數(shù)字也是數(shù)字。
在AlphaGo之前最好的人工智能棋手達到了業(yè)余五段。而 AlphaGo 最新的 Master 和職業(yè)九段之間的差距,大致相當于職業(yè)九段和業(yè)余九段的差距。這確實是很大的跳躍。
那為什么會有這樣的現(xiàn)象呢?也就是說,為什么下圍棋的人工智能進步幅度這么大呢?
其實有一個非常現(xiàn)實的理由,就是想掙錢的人不會去做圍棋。你看 AlphaGo 的專家隊伍也沒那么了不起,就是二十個很厲害的機器學習專家。在谷歌里面可能有兩千個這樣的人,在微軟里有一千個這樣的人。原因在于微軟和谷歌過去沒有想拿兩千個專家的力量打敗圍棋手,他們的更多時間都在做語音識別、人臉識別這些有價值的事情。
在這個沒有價值的事情上 ,能用二十個專家就不錯了。
金融、醫(yī)療是有商業(yè)價值的 AI
有商業(yè)價值的 AI,影響就巨大了。
AI 在數(shù)據(jù)量大的領(lǐng)域最易應(yīng)用。這些數(shù)據(jù)最好被準確標注,自動化標注。
AI 在無摩擦的領(lǐng)域最容易應(yīng)用。一個領(lǐng)域里面如果有制造、測試、物流這類摩擦,那就麻煩了。無摩擦的領(lǐng)域是什么?醫(yī)療是無摩擦,金融是無摩擦。
AI 在掙錢最多的領(lǐng)域容易應(yīng)用。毫無疑問,最掙錢的又是金融。
所以金融毫無疑問會是AI最快征服的領(lǐng)域。因為你的算法可以很快就變成錢。
醫(yī)療也是一個特別巨大的領(lǐng)域。而且醫(yī)療相對傳統(tǒng),能產(chǎn)生增值的機會很大。而且它不是基于大數(shù)據(jù)的。最好的醫(yī)生是什么,就是他自己是一個深度學習的機器,根據(jù)他的經(jīng)驗做了好多好多次。
假設(shè)他判斷了五千個病人,判對了很多,判錯了一些,下面他的判斷就會非常精準了。但一個好醫(yī)生可能最多也就判斷過五千個病人,但我們的數(shù)據(jù)是五千萬的病人的級別。所以醫(yī)療超越醫(yī)生應(yīng)該是一個非常必然的,全球性的趨勢。
但是AI 醫(yī)療需要突破一些隱私問題,可能會有一些挑戰(zhàn)。
機器人世界的大門,要靠智能駕駛來敲開
除了大數(shù)據(jù)應(yīng)用之外,還有就是科幻型的應(yīng)用了。包括機器人,無人駕駛這類領(lǐng)域。
目前看得非常清晰,而且全球達到共識就是無人駕駛。有時候你要做一個科幻型的東西,需要萬事俱備,天時地利人和才能推動。但是一旦開始動它就不得了。就像以前我們的移動互聯(lián)網(wǎng)改造了整個產(chǎn)業(yè)鏈,以前的 SP、諾基亞之類。這樣的產(chǎn)業(yè)變革來臨,基本舊的企業(yè)全部會死掉,換成一批新的。
出行就會是下一個產(chǎn)業(yè)。我們非常幸運,目前有了共享經(jīng)濟,還有電動車。這兩個領(lǐng)域已經(jīng)在推動了,可推一推目前遇到一些阻力。
現(xiàn)在無人駕駛一來,會改變世界的經(jīng)濟格局。我相信,世界經(jīng)濟10%是和出行和運輸相關(guān)的。雖然真正的無人駕駛到來可能還要十年,但是有些其他的事情可以更快地被做好。
比如景區(qū)游覽車,比如運輸卡車。
你可能會問,如果自動駕駛技術(shù)暫時還不成熟,卡車下了高速公路怎么辦?沒問題,我們把倉庫全停在高速公路旁邊不就是了。
萬一卡車看錯路怎么辦?那我們就重新修路,在路上放很多標志和傳感器,這也不是很困難。
所以我們未來三五年我們就可以打很多補丁,讓無人駕駛能夠在很多有限的環(huán)境之下被使用,所以千萬不要認為自動駕駛還有十年才來,現(xiàn)在跟我們無關(guān)。
我們很少看到有一個產(chǎn)業(yè)從頭到尾全部都“投降”了。
哪一家汽車公司還敢不說無人駕駛?每一家都在拼命想辦法去解決,整個產(chǎn)業(yè)力量都進來了。
資本的力量在全球都在投資無人駕駛的公司。
最新最酷的創(chuàng)業(yè)者,很多都在無人駕駛領(lǐng)域創(chuàng)業(yè)。
這是一個不可逆的必然趨勢,會對各個行業(yè)做全新的布局。
例如,所有的司機該怎么辦?沒有車會停下來,停車場該怎么辦?以后的汽車該什么樣子?道路要提供什么傳感器?哪些領(lǐng)域是最快能夠賺最多錢的?
這些我們其實都不必太擔心,因為那些最有商業(yè)嗅覺的人和最有科技能力的人已經(jīng)在每天在推敲這個事情。他們,或者說我們一定會找到解決方案。
當一輛無人駕駛汽車可以在路上運行的時候,汽車之間就可以對話了。例如前面發(fā)生了車禍,我的車要做出避讓。今天我的主人著急上班,你給我讓路,我給你兩毛錢行不行?
在這種情況下機器人就變得可行了。與其期待家里的機器人用陪小孩玩的方式進化,還不如期待無人駕駛汽車促進機器人的進化。