ITBear旗下自媒體矩陣:

解密特斯拉自動(dòng)駕駛芯片和背后一號(hào)人物

   時(shí)間:2017-12-26 09:06:26 來源:智東西編輯:星輝 發(fā)表評(píng)論無障礙通道

文/Origin

上周,智東西撰文介紹了英特爾的AI芯片Nevarna;緊接著,國(guó)內(nèi)地平線發(fā)布了AI芯片旭日與征程。“AI芯片”這個(gè)一年之前還處于無名狀態(tài)的詞,已經(jīng)成為一片紅海。

在自動(dòng)駕駛領(lǐng)域,AI芯片其實(shí)并非新奇玩意。Mobileye的EyeQ系列芯片,就是較早應(yīng)用于自動(dòng)駕駛的AI芯片之一。而在這個(gè)月早些時(shí)候,硅谷鋼鐵俠馬斯克,還宣布了特斯拉正在研發(fā)用于自動(dòng)駕駛的AI芯片,回顧馬斯克對(duì)自動(dòng)駕駛芯片的各種動(dòng)作,我們發(fā)現(xiàn)近來各種跳票“不靠譜”的他,其實(shí)對(duì)技術(shù)發(fā)展的趨勢(shì),遠(yuǎn)比看上去更理解。

馬斯克對(duì)特斯拉自行研發(fā)自動(dòng)駕駛芯片的布局,從兩年前就開始了。

一、從Mobileye到英偉達(dá) 特斯拉的自動(dòng)駕駛焦慮癥

2014年,特斯拉找上Mobileye,用上了它家的新一代輔助駕駛芯片EyeQ3,來武裝自家的獨(dú)門絕技——自動(dòng)駕駛系統(tǒng)Autopilot。

在這個(gè)時(shí)間點(diǎn),EyeQ3無疑是最好的選擇。它的計(jì)算性能達(dá)到300Gflops(每秒3000億次浮點(diǎn)運(yùn)算),并且內(nèi)部封裝了先進(jìn)的ADAS算法,廣泛用于各家車廠的的ADAS系統(tǒng)中。

(圖中圈內(nèi)為EyeQ3)

(圖中圈內(nèi)為EyeQ3)

但對(duì)特斯拉來說,Mobileye的EyeQ3成在這一點(diǎn),敗也敗在這一點(diǎn)。去年特斯拉Model S撞卡車事件發(fā)生后,特斯拉與Mobileye開始分道揚(yáng)鑣。當(dāng)時(shí)人們普遍認(rèn)為是這場(chǎng)事故導(dǎo)致了雙方的信任破裂——對(duì)特斯拉來說,Mobileye并不保證自動(dòng)駕駛足夠安全,而Mobileye也很冤,因?yàn)楫?dāng)時(shí)還只定位于ADAS而已,特斯拉車主違規(guī)操作不僅害死了自己還讓Mobileye的名聲遭受了打擊。

不過,這件事雖然看上去是特斯拉與Mobileye蜜月結(jié)束的導(dǎo)火索,但背后的原因仍然是,特斯拉的計(jì)算力焦慮。 馬斯克一再宣稱要將全自動(dòng)駕駛短期內(nèi)帶上特斯拉的Model系列,但從未實(shí)現(xiàn)過。一個(gè)重要的原因就是,Mobileye的EyeQ3這塊芯片,在計(jì)算力上并不能滿足需求,它只是為ADAS設(shè)計(jì)的。

而在2016年初,英偉達(dá)推出了Drive PX 2,理論計(jì)算性能最高達(dá)到10Tflops,比EyeQ3的性能來得要粗暴得多。并且,希望在自動(dòng)駕駛領(lǐng)域建立起自家GPU計(jì)算生態(tài)的英偉達(dá),給需求較大的特斯拉還開出了優(yōu)惠的價(jià)格。此時(shí)急于對(duì)自動(dòng)駕駛功能進(jìn)行升級(jí)的特斯拉,選擇再度回歸英偉達(dá)的擁抱,到也顯得合情合理。

以Model 3為例,其為自動(dòng)駕駛功能和環(huán)視配置了8枚攝像頭與12枚超聲波雷達(dá)以及一枚毫米波雷達(dá),大量的視頻圖像數(shù)據(jù)處理以及在其之上運(yùn)行圖像識(shí)別算法,將會(huì)消耗巨量的計(jì)算資源,這顯然是算力只有300G的EyeQ3力所不及的。

相對(duì)于EyeQ3只是一塊ADAS芯片,Drive PX 2實(shí)質(zhì)上是一臺(tái)車載電腦,是更加完整的解決方案。

上圖為Drive PX 2 AutoCruise,下圖為Autochauffeur。

上圖為Drive PX 2 AutoCruise,下圖為Autochauffeur。

在配置了Drive PX 2過后,特斯拉在度過車禍?zhǔn)录囊魂嚨驼{(diào)過后,確實(shí)也對(duì)自動(dòng)駕駛功能進(jìn)行了更新。車東西不久前曾體驗(yàn)過特斯拉新的AutoPilot,發(fā)現(xiàn)開啟后維持在一條車道上撒手不管也沒問題,不過特斯拉依然做了限制,時(shí)間太長(zhǎng)系統(tǒng)會(huì)發(fā)出警報(bào)。

但Drive PX 2就能解決馬斯克的焦慮了嗎?顯然也不能。因?yàn)镈rive PX 2實(shí)質(zhì)上有多個(gè)版本,其中算力較高的是Autochauffeur,算力較低的是Drive PX 2 AutoCruise,其上只搭載了一個(gè)Nvidia Parker Soc。

有國(guó)外車主拆解過特斯拉Model S上配置的Drive PX 2,它長(zhǎng)這樣:

(英偉達(dá)為特斯拉定制的Drive PX 2車載電腦)

(英偉達(dá)為特斯拉定制的Drive PX 2車載電腦)

可以看到,特斯拉所用的Drive PX 2并沒有像Autochauffeur版本那樣使用了兩枚Soc+兩塊額外的GPU,而是只有一個(gè)Parker Soc+一塊獨(dú)立GPU。因此特斯阿拉所用的,更像是英偉達(dá)為其定制的AutoCruise版本。對(duì)于Drive PX 2,英偉達(dá)自身都明明白白地說過,要經(jīng)過多塊(多塊Autochauffeur)疊加,才能滿足L4級(jí)自動(dòng)駕駛的算力需求。所以對(duì)于特斯拉上面的Drive PX 2,我們也可以明確其算力支持,不會(huì)超過L3水平。

并且,GPU為主的計(jì)算架構(gòu),一直有著功耗高的問題。為了給這塊Drive PX 2散熱,特斯拉使用了兩枚風(fēng)扇,也說明Drive PX 2的熱設(shè)計(jì)功耗,至少是在50-100W區(qū)間(英偉達(dá)硬件工程師曾向車東西表示,雙Soc+雙獨(dú)立Pascal顯卡的Autochauffeur功耗在150W)。

高成本、高功耗,算力還無法完全滿足需求,即使是號(hào)稱超級(jí)車載電腦的Drive PX 2,依舊有著這三個(gè)問題。而這些,對(duì)自動(dòng)駕駛量產(chǎn)車來說,都是致命的。于是英偉達(dá)也拿出了下一代的Xavier作為應(yīng)對(duì),功耗/性能比大幅升級(jí),但它的裝車量產(chǎn)要到2019年。

馬斯克早已等不及了。

二、攬來大牛沉寂兩年? 只因在憋大招

馬斯克是個(gè)聰明人,不會(huì)吊死在一棵樹上,這一點(diǎn),從特斯拉的計(jì)算芯片先使用Mobileye EyeQ3再轉(zhuǎn)入Drive PX 2就能看出來。

如果別人的樹上結(jié)不出果子,那么自己種一顆也不是不行。

2016年1月,特斯拉的硬件工程部門迎來了新的副總裁,一名做芯片架構(gòu)設(shè)計(jì)的工程師,名叫吉姆·凱勒,跟他一起來到特斯拉的,還有曾經(jīng)在他工作過的AMD、P.A Semi、蘋果公司中任職過的數(shù)十名芯片行業(yè)的人才。

(吉姆·凱勒)

(吉姆·凱勒)

跟馬斯克一樣,吉姆·凱勒也是個(gè)不甘寂寞的人。吉姆·凱勒早年間在AMD任職,深度參與了x86-64架構(gòu)的定制工作,讓曾經(jīng)只支持32位的X86升級(jí)到了64位。這也是吉姆·凱勒可能作出的最大貢獻(xiàn)——眼下各位內(nèi)置了英特爾、AMD處理器的64位PC,都有吉姆·凱勒的功勞。

吉姆凱勒也幫助AMD拿出了K7、K8架構(gòu),使得AMD在與英特爾的CPU競(jìng)爭(zhēng)中用速龍壓制了奔騰(雖然并未維持多久)。

隨后,吉姆·凱勒從AMD離職,后來又加入半導(dǎo)體設(shè)計(jì)公司P.Asemi出任副總裁,專事設(shè)計(jì)低功耗處理器。2008年,蘋果收購(gòu)了P.A。于是吉姆·凱勒又成為了蘋果A4、A5處理器的設(shè)計(jì)領(lǐng)頭人。

在兩家著名公司中領(lǐng)導(dǎo)芯片項(xiàng)目,并且最終產(chǎn)品造福了以億計(jì)的人們,吉姆·凱勒可以說是功成名就了,但他的故事還將繼續(xù)。

2012年,吉姆·凱勒重返A(chǔ)MD,出任芯片首席架構(gòu)師。此時(shí)的AMD已經(jīng)在CPU市場(chǎng)上被英特爾打得滿地找牙,“i3默秒全”早已成為圈內(nèi)的笑談。 吉姆在AMD待了三年,在2015年9月離職。他做了啥?幫AMD打造了新的處理器架構(gòu)“Zen”。今年,當(dāng)基于Zen架構(gòu)打造的AMD 銳龍?zhí)幚砥髡Q生時(shí),當(dāng)年AMD速龍對(duì)決英特爾的輝煌再度上演,升級(jí)緩慢的英特爾大幅提高了下代處理器的性能作為應(yīng)對(duì)。

因此,吉姆·凱勒其實(shí)是充當(dāng)了AMD的“救世主”,而且是在兩年前救的,而且是救完就走,不留下一片云彩。

(AMD銳龍?zhí)幚砥鳎? width=

(AMD銳龍?zhí)幚砥?

起2016年加入特斯拉的消息表明,救完AMD過后,吉姆·凱勒又拯救陷入“自動(dòng)駕駛謊言”中的特斯拉去了。

事實(shí)上,馬斯克在2015年就感受到了特斯拉可能會(huì)面臨的自動(dòng)駕駛,當(dāng)年主動(dòng)發(fā)推文,先行大力招募自動(dòng)駕駛的軟件人才,而后對(duì)AMD、英特爾、蘋果等公司的硬件人才挖角行動(dòng)也沒有停過。

獲得吉姆·凱勒過后,特斯拉與芯片制造商/代工商的接觸開始變多。去年9月,消息一度傳出,三星將幫助特斯拉打造車載芯片,后來消息不了了之。今年早些時(shí)候,CNBC曾報(bào)道AMD將與特斯拉合作打造芯片,聽上去可信度很高——吉姆·凱勒來自AMD,而特斯拉方面也曾經(jīng)表示,他們?cè)谧詣?dòng)駕駛芯片上的選擇很靈活。

今年9月,AMD的拆分子公司、芯片代工方格羅方德在對(duì)外演示中無意走漏風(fēng)聲,稱正在與特斯拉合作。后來格羅方德辟謠稱與特斯拉并沒有直接合作(也等于間接指出特斯拉在于AMD合作)。一時(shí)間特斯拉自研芯片的消息再度沸沸揚(yáng)揚(yáng),AMD還因?yàn)檫@個(gè)利好消息股價(jià)小漲一波。車東西也對(duì)此事進(jìn)行了深度分析(詳見文章:自動(dòng)駕駛芯片戰(zhàn)爭(zhēng)爆發(fā))

直到12月,面對(duì)不斷下行的股價(jià)壓力,馬斯克把這個(gè)消息當(dāng)做利好放了出來。

如果從吉姆·凱勒加入開始算起,到這個(gè)時(shí)候,特斯拉的自研芯片計(jì)劃其實(shí)已經(jīng)潛行了快兩年。兩年時(shí)間,對(duì)外零成果,這完全不符合特斯拉的風(fēng)格。為何一向求快的特斯拉,此時(shí)卻穩(wěn)了起來?

因?yàn)樘厮估邪l(fā)的,正是面向自動(dòng)駕駛的ASIC。(馬斯克原話是“developing specialized AI hardware”)

ASIC,Application Specific Integrated Circuit,專用集成電路,意思就是面向?qū)iT計(jì)算用途打造的芯片。其特點(diǎn)是在某一特定領(lǐng)域的計(jì)算上能夠以更低的功耗獲得更高的性能。 另一個(gè)特點(diǎn)則是,研發(fā)周期長(zhǎng),時(shí)間通常超過一年。

對(duì)于特斯拉來說,在應(yīng)用了高功耗的Drive PX 2仍然無法實(shí)現(xiàn)高級(jí)自動(dòng)駕駛過后,研發(fā)出自己掌握的、2-3年的時(shí)間是值得等待的。特別是,當(dāng)這個(gè)芯片項(xiàng)目是由吉姆·凱勒主導(dǎo)時(shí)。

吉姆·凱勒在輾轉(zhuǎn)AMD與蘋果的過程中,曾經(jīng)開發(fā)過基于MIPS架構(gòu)的網(wǎng)絡(luò)芯片,還開發(fā)過基于ARM V8架構(gòu)的服務(wù)器芯片(MIPS、ARM V8都是RSIC精簡(jiǎn)指令集架構(gòu),一般來說在功耗上具有優(yōu)勢(shì)) 擁有了豐富的低功耗芯片設(shè)計(jì)經(jīng)驗(yàn),結(jié)合其此前在高性能芯片上的設(shè)計(jì)能力,他為特斯拉帶來的將是功耗/性能表現(xiàn)更加優(yōu)越、高度適配自動(dòng)駕駛軟件算法的專用芯片。

在馬斯克放出特斯拉將自研芯片消息時(shí),他如此形容這款芯片的優(yōu)勢(shì)——“this can give 10x power at a tenth the cost”。什么意思?能以十分之一的功耗,實(shí)現(xiàn)十倍的性能。吉姆·凱勒也稱,現(xiàn)在的AI技術(shù)在進(jìn)行應(yīng)用時(shí),功耗是一個(gè)常被忽視的元素。

從特斯拉眾人的一席話中可以看出,他們研發(fā)的這款自動(dòng)駕駛芯片,將在功耗/性能比上下更多功夫。

特斯拉芯片最大可能的代工方格羅方德,也擁有專門面向低功耗的芯片工藝——FD-SOI。近年格羅方德剛剛實(shí)現(xiàn)了FD-SOI的22納米制程升級(jí),宣稱功耗比28nm降低了70%,該工藝相較于我們較為熟悉的FinFET而言,更適合需要低功耗芯片的移動(dòng)計(jì)算等場(chǎng)景。

當(dāng)然,低功耗并不代表低性能。以特斯拉的舊愛Mobileye為例,其明年將要量產(chǎn)的EyeQ4系列芯片,采用MIPS架構(gòu)搭建,能夠以3W的功耗,實(shí)現(xiàn)2.5Tflops的計(jì)算性能。

而同時(shí)玩過X86、MIPS、ARM v8架構(gòu)的吉姆·凱勒,玩芯片性能跑得上得去,做功耗優(yōu)化也降得下來。

三、特斯拉自研背后 自動(dòng)駕駛芯片正在轉(zhuǎn)向

特斯拉自研自動(dòng)駕駛芯片,其實(shí)反映了隨著自動(dòng)駕駛行業(yè)成長(zhǎng)、需求明確,其計(jì)算的需求由通用轉(zhuǎn)向了專用,運(yùn)行的由訓(xùn)練走向了落地(Inference,推斷),隨著自動(dòng)駕駛向量產(chǎn)推進(jìn),自動(dòng)駕駛系統(tǒng)所需要的芯片,由原本不計(jì)代價(jià)、不懼高功耗追求絕對(duì)算力的GPU,走向低成本(前提是大規(guī)模量產(chǎn)攤薄成本)、低功耗、高性能的ASIC。

曾有整車廠出身的自動(dòng)駕駛創(chuàng)業(yè)者向車東西吐槽,業(yè)內(nèi)許多創(chuàng)業(yè)者完全沒有考慮過自動(dòng)駕駛的量產(chǎn)問題,其中一個(gè)顯著表現(xiàn)就是大量堆砌高功耗的計(jì)算核心,“將數(shù)塊GPU拼在一起”,放在車輛的后備箱中。而現(xiàn)在對(duì)于要量產(chǎn)的自動(dòng)駕駛車來說,其計(jì)算核心必須是嵌入式的,不僅要滿足計(jì)算性能,同時(shí)要滿足低功耗需求,同時(shí)成本要可接受,此時(shí)ASIC是看上去最可行的方案。

盡管ASIC開發(fā)的周期不短,需要的資金也十分驚人(制程較先進(jìn)時(shí)僅是單次流片可能就需要數(shù)百萬美元),但一旦投入量產(chǎn)、規(guī)模鋪開,芯片產(chǎn)業(yè)的邊際效用會(huì)立即發(fā)揮,將單枚芯片成本壓低。

對(duì)于特斯拉來說,盡管自研自動(dòng)駕駛芯片的風(fēng)險(xiǎn)巨大,初始成本高昂,但一旦投入使用,帶來的各種收益將是顯著的。除了降成本、降功耗,另一點(diǎn)就是頻頻被提及的自主性:全世界的科技企業(yè)都從蘋果的成功中學(xué)習(xí)到一點(diǎn)——軟硬件一體的威力。

自研芯片的特斯拉,不僅能夠?yàn)锳utopilot提供定制化的硬件支持,同時(shí)也可以將大量自動(dòng)駕駛算法直接封裝到芯片內(nèi)。構(gòu)建起這樣的能力,將成為特斯拉在自動(dòng)駕駛競(jìng)賽中的核心優(yōu)勢(shì)。

除了特斯拉之外,還有其他公司已經(jīng)走上了這條道路。

上周,國(guó)內(nèi)自動(dòng)駕駛芯片初創(chuàng)公司地平線,推出了兩款A(yù)I芯片,其中一枚,正是面向自動(dòng)駕駛的ASIC“征程”。在參數(shù)上,征程能夠以1.5W的功耗,實(shí)現(xiàn)1Tflops的算力,每秒處理30幀4K視頻,對(duì)圖像中超過200個(gè)物體進(jìn)行識(shí)別。

性能功耗比可以直接反映出在自動(dòng)駕駛領(lǐng)域,ASIC面對(duì)GPU時(shí)所展現(xiàn)出來的優(yōu)勢(shì)——征程每瓦特功耗實(shí)現(xiàn)了0.666T的計(jì)算力,而英偉達(dá)此前推出的Drive PX 2 ,以150W的高功耗,實(shí)現(xiàn)的是不到24T的算力。若如此計(jì)算,“征程”的性能功耗比達(dá)到Drive PX 2的3倍還多。

并且,由于ASIC不是GPU類的通用計(jì)算,內(nèi)部直接封裝了算法,數(shù)據(jù)交換只是底層I/O,因此其計(jì)算的時(shí)延也會(huì)比GPU更低。也是因?yàn)檫@個(gè)原因,盡管“征程”這枚ASIC在絕對(duì)算力上要比Drive PX 2 Autochauffeur 低上不少,但地平線也稱其能夠滿足L3的計(jì)算需求。

而有吉姆·凱勒坐鎮(zhèn)、財(cái)力也更雄厚的特斯拉,在自動(dòng)駕駛ASIC上做得更好,只是必然。

當(dāng)然,與特斯拉分手的英偉達(dá)自己也非常清楚GPU路徑的優(yōu)勢(shì)與不足,在下一代的計(jì)算核心Xaiver中,將采用CPU+GPU+ASIC的異構(gòu)計(jì)算方案,Xiaver在提供給不同的合作伙伴時(shí)可以采用定制方案。英偉達(dá)未選擇轉(zhuǎn)入ASIC的路徑,是因?yàn)楫吘惯€要做生態(tài),拋棄GPU就沒法玩了。不過生態(tài)也是英偉達(dá)最好的武器,除了底層的cuDNN和Tensor RT等,英偉達(dá)還提供在云端強(qiáng)大的訓(xùn)練能力,以及大量的自動(dòng)駕駛通用算法,包括提供車輛、行人、紅綠燈識(shí)別能力和可行駛區(qū)域檢測(cè)能力的DriveWorks。這極大地降低了自動(dòng)駕駛開發(fā)的上手難度,對(duì)于不像特斯拉那樣追求極致的后來者們,生態(tài)完整的英偉達(dá)仍然是良好選擇。

結(jié)語:自動(dòng)駕駛芯片或成特斯拉下一輪救星

盡管馬斯克聲稱,特斯拉正在打造的AI專用芯片“將是世界上最好的AI芯片”,但并未透露它什么時(shí)候會(huì)誕生。不過,馬斯克已經(jīng)再一次“夸下???rdquo;,要在2019年實(shí)現(xiàn)完全的自動(dòng)駕駛。有吉姆·凱勒這樣的大神助陣,馬斯克這一次的承諾跳票可能性看上去小了那么一丟丟。不過,按照人們對(duì)特斯拉的期望值來看,只要它能夠?qū)崿F(xiàn)高度自動(dòng)駕駛,即使稍微晚來了幾年,也沒有關(guān)系。

只是問題在于,無論是地平線這樣的初創(chuàng)公司,還是Mobileye這樣的老牌,都在自動(dòng)駕駛ASIC這條道路上越走越遠(yuǎn)。在短暫引領(lǐng)自動(dòng)駕駛(實(shí)質(zhì)仍是輔助駕駛)風(fēng)騷過后,特斯拉的優(yōu)勢(shì)已經(jīng)不再明顯。

但馬斯克常常能化不可能為可能,無論是造出一輛續(xù)航超過500公里的電動(dòng)車,還是實(shí)現(xiàn)運(yùn)載火箭的回收。這一次,有芯片大神吉姆·凱勒的坐鎮(zhèn),特斯拉在自動(dòng)駕駛芯片上可能實(shí)現(xiàn)的成就,不可小覷。一旦問世,它或許就會(huì)成為“不思進(jìn)取”的AutoPilot的救星。

在特斯拉的不斷跳票與被拯救中,自動(dòng)駕駛正在悄悄走向量產(chǎn)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version