在人工智能、虛擬現(xiàn)實這撥熱潮來臨的時候,有無數(shù)創(chuàng)業(yè)公司開始重新審視自己的定位,并將原有項目或業(yè)務向人工智能、虛擬現(xiàn)實等方向傾斜。更多的公司還在尋找適合自己的商業(yè)模式,在盈利的路上披荊斬棘。而對于上游芯片廠商來講,雖然風口在不斷變幻,但各個行業(yè)對于計算的要求并沒有轉(zhuǎn)移,相反需求量仍然持續(xù)增長。
黃仁勛創(chuàng)立的NVIDIA(英偉達)在1999年發(fā)明GPU的時候,他當時并沒有意識到GPU在未來人工智能、虛擬現(xiàn)實等領域會有如此大的發(fā)展空間。憑借著GPU的威力,NVIDIA也正在從一個圖形芯片公司,向AI計算公司轉(zhuǎn)型。
新技術計算需求給芯片公司帶來新機會
在2014年之前,在消費級市場,GPU主要應用于游戲特效的渲染,在商用市場也局限于工業(yè)設計、影視制作、超級計算機等領域。黃仁勛在GTC開發(fā)者大會中國站透露,近三年來,業(yè)界對GPU計算的需求出現(xiàn)了爆炸式增長。其中,與人工智能息息相關的深度學習計算,負載需求增長了16倍,這個數(shù)字要比摩爾定律還要高出很多。而僅僅兩年的時間,下載基于GPU的深度神經(jīng)網(wǎng)絡實驗室引擎開發(fā)者數(shù)量就增長了25倍 ,從2014年的2200次,迅速增長到目前的5.5萬次。
據(jù)稱,使用深度神經(jīng)網(wǎng)絡的開發(fā)人員,有很多是人工智能的研究人員。黃仁勛稱,現(xiàn)在所有的實驗室都會使用NVIDIA的GPU平臺來做AI研究,這里面既有軟件公司,也有互聯(lián)網(wǎng)軟件提供商,還有互聯(lián)網(wǎng)公司、汽車公司、政府、醫(yī)療成像、財務、制造等公司。其中,百度近幾年來一直在使用GPU做AI人工智能方面的研究。據(jù)稱,目前使用語音識別在手機上進行輸入,速度已經(jīng)達到了鍵盤輸入的3倍。而這樣的成績,離不開給百度后臺提供強大計算能力的硬件設備。
業(yè)界對計算能力的需求,集中體現(xiàn)在對芯片的采購上,這從上游芯片公司的財報就能一窺端倪。
英特爾最新財報顯示,2016年二季度營收為135億美元,同比增長3%,凈利潤為13億美元,同比下滑51%,按非美國通用會計準則(Non-GAAP),凈利潤為29億美元,比上年同期的31億美元下滑6%。英特爾凈利下滑的主要原因是二季度的財報中加入了約14億美元的重組費用。英特爾計劃2017年年中前裁員1.2萬人,以便削減成本,專注于目前需求強勁的服務器芯片和物聯(lián)網(wǎng)芯片業(yè)務。
如果分解來看,客戶計算集團二季度凈營收為73.38億美元,去年同期為75.37億美元;運營利潤為19.71億美元,去年同期為16.03億美元。數(shù)據(jù)中心集團二季度營收為40.27億美元,去年同期為38.52億美元;運營利潤為17.65億美元,去年同期為18.43億美元。物聯(lián)網(wǎng)集團二季度營收為5.72億美元,去年同期為5.59億美元;運營利潤為8900萬美元,去年同期為1.45億美元。其中對新興技術有重要影響的數(shù)據(jù)中心集團、物聯(lián)網(wǎng)集團運營數(shù)據(jù)都比較突出。
NVIDIA的數(shù)據(jù)則更夸張,根據(jù)其2017財年二季度財報顯示,當季收入14.3億美元,同比增長24%,凈利2.53億美元,同比增長873%。同時,為了鼓勵創(chuàng)業(yè),NVIDIA發(fā)布了Inception Program創(chuàng)始計劃,以便讓參與其中的成員能夠利用NVIDIA 的技術與專長來助力初創(chuàng)企業(yè)的成長,在深度學習與數(shù)據(jù)科學領域?qū)崿F(xiàn)突破。黃仁勛對搜狐科技表示,目前全球人工智能方面的創(chuàng)業(yè)公司已經(jīng)超過1500多家,創(chuàng)始計劃發(fā)布以來,已經(jīng)有700多家企業(yè)與NVIDIA展開合作,除了能獲得NVIDIA的技術和專家支持外,這些企業(yè)還能得到其全球市場營銷平臺的支持,也有獲得投資的機會。
高通2016年第三財季凈利潤同比也出現(xiàn)了大幅度的增長。數(shù)據(jù)顯示,當季其營收為60.44億美元,同比增長4%。凈利潤為14.44億美元,同比增長22%,增長勢頭明顯。高通CEO莫倫科夫稱,高通的芯片業(yè)務增長,主要受益于各級廠商推出了更多新產(chǎn)品,尤其是快速成長的中國OEM廠商。據(jù)了解,當季高通的芯片出貨量超過2億片。
企業(yè)對計算能力需求有多高?
百度首席科學家吳恩達多年來一直在進行人工智能方面的研究。2014年,在訓練語音識別時,模型中有2500萬個參數(shù),訓練的材料是7000小時,語音識別的錯誤率為8%,大約每12個詞中就有一個是錯的。而到了2015年,語音識別訓練的數(shù)據(jù)量是之前的2倍,深度學習的網(wǎng)絡是原來的4倍大,錯誤率降低到了5%。在1年的時間里,錯誤率與之前相比降低了40%左右。這背后,需要強大的計算能力支持,錯誤率僅僅降低3個百分點,就需要20萬億次浮點運算的支持。
在談到深度學習對計算的需求時,吳恩達表示,通過百度多年來的經(jīng)驗,單純使用云計算并不能真正促進深度學習發(fā)展。使用HPC高性能計算,以及使用超級計算機才是更能促進深度學習算法進步的一個方向,因此,現(xiàn)在最先進的深度學習系統(tǒng)已經(jīng)開始使用高性能算法。吳恩達稱,百度是全球第一個為深度學習建立GPU集群的公司。通過AI訓練,百度也將取得的成果不斷應用到實際當中。據(jù)了解,目前百度語音識別、自動駕駛、百度大腦等項目已經(jīng)取得很大的發(fā)展。在今年的百度世界大會上,人工智能貫穿會議的整個過程,成為大會的核心主題。李彥宏甚至強調(diào),人工智能是百度核心中的核心。
為了能夠滿足電商平臺的計算需求,京東在兩年前曾與英特爾達成戰(zhàn)略合作。雙方在基礎架構、服務器、系統(tǒng)軟件、硬件優(yōu)化、網(wǎng)絡系統(tǒng)、云平臺等領域聯(lián)合開發(fā),以提升電商平臺的技術水準。
日前,京東與NVIDIA也宣布戰(zhàn)略合作,雙方將加強在人工智能領域的全面合作,加速智能電商時代到來。據(jù)京東集團首席技術顧問翁志介紹,京東電商平臺每天上傳的圖像超過500萬張,對圖像進行甄別需要優(yōu)秀的算法和計算資源支持。現(xiàn)在機器學習已深入到圖像識別、大數(shù)據(jù)處理、個性化推薦等方方面面。在京東發(fā)布VR、AR戰(zhàn)略后,更是離不開GPU加速計算的支持。據(jù)了解,目前京東的機器學習多半都建立在GPU計算之上。
對阿里巴巴來講,云計算與大數(shù)據(jù)已經(jīng)成為其戰(zhàn)略重點之一,阿里甚至希望其平臺能夠為中國互聯(lián)網(wǎng)70%的流量完成相關的計算任務。阿里巴巴技術保障部系統(tǒng)研發(fā)總監(jiān)高山淵稱,阿里的業(yè)務增長速度遠遠超過摩爾定律。數(shù)據(jù)顯示,2015年“雙11”阿里平臺交易額達到912億元,訂單的創(chuàng)建峰值達到每秒14萬筆,支付寶支付的峰值達到每秒8.59萬筆。在這些數(shù)字的背后都需要非常強大的計算平臺去支撐。據(jù)了解,阿里云計算平臺已經(jīng)服務于全球180萬家企業(yè),在全球有30多個數(shù)據(jù)中心。
為了滿足計算性能的需求,阿里甚至與英特爾合作定義了一套評價CPU性能指標的體系,并命名為“AliBench”。在這套體系背后,綜合了電商、金融平臺、物流、娛樂、云計算、大數(shù)據(jù)等一系列的需求,來綜合評價一個指標,并評價一款CPU是否符合阿里的要求。據(jù)搜狐科技了解,為了滿足阿里的計算需求,阿里與英特爾合作,專門定制至強CPU,以便在性能功耗比方面有更好的提升。
英偉達要革英特爾的命?
目前流行的人工智能、VR、AR等技術,都離不開GPU的加速計算支持。從NVIDIA的數(shù)據(jù)來看,在這些領域,GPU的效率遠超CPU。此前NVIDIA推出了一款DGX-1超級計算機,這款專為深度學習設計的系統(tǒng),吞吐量相當于250臺CPU服務器及其相應的網(wǎng)絡、線纜和機架,可以將深度學習的培訓速度加快75倍,將CPU性能提升56倍。
本月初,IBM發(fā)布了新款Power LC服務器,這款采用了NVIDIA技術與POWER8平臺的產(chǎn)品專注于加速人工智能、深度學習及高級分析應用。IBM方面稱,這款處理器能實現(xiàn)比其他平臺高5倍的數(shù)據(jù)處理速度,與最新的x86服務器相比,每花費一美元能獲得高于x86服務器80%的性能。
從服務器性能及企業(yè)對GPU加速計算的需求來看,似乎CPU已經(jīng)明顯處理劣勢。不過,黃仁勛并不這么認為。據(jù)搜狐科技了解,多年來,黃仁勛曾在不同的場合,多次強調(diào)GPU與CPU的關系。這兩種產(chǎn)品之間并不是你死我活的競爭對手,而是各有所長。
黃仁勛對搜狐科技表示,CPU和GPU在工作過程中要相互配合,而不是各自分開。兩者是非常不同的處理器,它們相互擅長的是不一樣的。CPU往往會是幾個性能非常高的處理器集成在一起,而GPU可能是數(shù)以千計、非常小,但是功耗比較低、能效非常高的小處理器。兩者的內(nèi)存架構、網(wǎng)絡連接的架構都不一樣,編程模式也是明顯不同,因此需要互相配合。
黃仁勛同時強調(diào),很多應用并不需要GPU存在,只能依靠CPU來完成。據(jù)稱,GPU在兩個領域比較強大,一個是計算圖形、虛擬現(xiàn)實領域,另一個是人工智能領域,尤其是深度學習領域。黃仁勛稱,NVIDIA的戰(zhàn)略并不是要取代CPU,而是GPU和CPU協(xié)同發(fā)揮作用,讓CPU和GPU各自去完成自己所擅長的功能。另外,NVIDIA市場重點也不是傳統(tǒng)的計算,不是手機和PC,而是游戲平臺、自動駕駛汽車、AI、數(shù)據(jù)中心等領域,因此,NVIDIA仍然需要與CPU來合作。
英特爾中國研究院智能互聯(lián)創(chuàng)新中心總監(jiān)、首席研究員張益民對搜狐科技表示,GPU和CPU要看應用需求及設備功耗。一般PC等客戶端直接用CPU就可以完成計算。據(jù)稱,GPU適合于大量數(shù)據(jù)并行的計算,而CPU則適合于通用計算,人工智能計算則兩種計算方式都包括。相對而言,CPU在進行計算時更加靈活。如果要加速AI,并保持很好的能效比,可能CPU加上專用加速器更合適。除了通用CPU外,英特爾近來來也開始布局FPGA,并收購了Altera,最近又收購了AI創(chuàng)業(yè)公司Nervana,這些產(chǎn)品都在提供專用加速器的能力。
英特爾要從一家PC公司轉(zhuǎn)型為一家驅(qū)動云計算和數(shù)以億計的智能互聯(lián)計算設備的公司。數(shù)據(jù)顯示,目前所有出貨的服務器當中,有7%可以做機器學習和深度學習,其中95%都是基于英特爾架構的產(chǎn)品。據(jù)英特爾銷售與市場事業(yè)部副總裁夏樂蓓介紹,英特爾在中國市場發(fā)布了全新的至強融核處理器。Altera也將其解決方案融入到英特爾產(chǎn)品線當中,通過融合FPGA的技術,能夠?qū)崿F(xiàn)在人工智能方面更強大的處理能力。
對于英特爾與NVIDIA在高性能方面的競爭,夏樂蓓對搜狐科技表示,對于任何一個行業(yè)來說競爭都是好事,因為競爭會帶來下一輪創(chuàng)新的浪潮。人工智能毫無疑問是下一代計算創(chuàng)新浪潮所在,而在這個浪潮當中中國發(fā)揮著非常重要的作用。英特爾一直秉承開放的態(tài)度,構建廣泛的創(chuàng)新平臺并開放給所有開發(fā)人員。因此,英特爾所采取的方式方法是不同的,英特爾并不僅關注深度學習,還關注人工智能作為一個整體的行業(yè)發(fā)展,所以它既包括了深度學習,也包括機器學習及與人工智能有關的方方面面。英特爾希望把人工智能整體技術發(fā)展所帶來的好處轉(zhuǎn)化成更好的、更優(yōu)化的商業(yè)上的成效,從而把人工智能的好處真正帶給最終消費者。
英特爾中國研究院院長宋繼強稱,在機器智能化發(fā)展方面,將經(jīng)歷從聯(lián)網(wǎng)、智能到自主的三個過程,英特爾構造了一個良性的循環(huán)網(wǎng)絡,從云端到最終的客戶端設備都有不同級別的硬件去支持其做智能化的演進。在云端有至強融核、Nervana技術;中間層有至強和FPGA,在前端有酷睿級別的產(chǎn)品,并帶有圖形加速,可以做深度學習、智能加速。同時還有小型化的產(chǎn)品,如最新發(fā)布的Euclid,這種把Atom級別的處理器和Real Sense攝像頭完全整合的模塊,就非常適合讓無人機、小型機器人直接使用,并同時可以做小型人工智能計算。之前發(fā)布的Curie模塊,也自帶了108個神經(jīng)原,可以直接把人體的動作做分類。因此,在人工智能領域,英特爾有完善的硬件產(chǎn)品做支持。同時,存儲、5G、安全等與人工智能息息相關的領域英特爾也有完整的方案。
上游廠商在人工智能、虛擬現(xiàn)實這一熱潮來臨之時,之間仍然充滿了競爭,不變的是各種技術對計算需求的增長,同時,云計算、人工智能、VR等新技術也給了創(chuàng)業(yè)公司更多的發(fā)展機會。