ITBear旗下自媒體矩陣:

Facebook透露如何為AI和VR打造硬件

   時間:2016-03-30 10:03:37 來源:網(wǎng)易科技編輯:星輝 發(fā)表評論無障礙通道
Facebook透露如何為AI和VR打造硬件

Facebook 正在打造下一代開源硬件,將新技術(shù)融入其數(shù)據(jù)中心平臺,F(xiàn)acebook使用大量強大科技——包括固態(tài)硬盤(SSDs), 圖形處理器(GPUs), 非易失性存儲器(NVM)和閃存簇(JBOFs)——以打造新的服務(wù)器和存儲裝置,加速基礎(chǔ)設(shè)施。

這些升級是Facebook打造強大數(shù)據(jù)中心網(wǎng)絡(luò)的一部分,這一網(wǎng)絡(luò)將擴展互聯(lián)網(wǎng)服務(wù)的邊界。

「接下來的十幾年,我們的體驗將更加依賴于人工智能和虛擬現(xiàn)實這類技術(shù),」Facebook CEO 馬克·扎克伯格說。「這對計算性能提出了更高要求,通過開放計算項目(Open Compute Project,以下簡稱OCP),我們正在開發(fā)全球性的基礎(chǔ)設(shè)施,讓人人都能享受互聯(lián)網(wǎng)服務(wù)。」

Facebook在開放計算峰會(Open Compute Summit,以下簡稱OCS)上公布了項目進展。OCS是不斷擴大的開源硬件社區(qū)成員的聚會,他們設(shè)計的產(chǎn)品在Facebook的數(shù)據(jù)服務(wù)器上煥發(fā)活力。峰會展示了許多基礎(chǔ)設(shè)施的升級。包括:

重新打造的服務(wù)器尺度形態(tài)來在同等能源消耗數(shù)量下提升性能。

新的高性能數(shù)據(jù)分析服務(wù)器,由GPUs驅(qū)動,而非CPUs。

改進后的存儲設(shè)備分隔單位(storage sled),在這里,最初的JBOD(just a bunch of disks)變成快得多的JBOF(just a bunch of flash)。

改進非易失性存儲器(NVM)實驗,為存儲分層提供更多選擇。

此次峰會標志著OCP項目成立五周年,也促使人們反思自2011年Facebook為推動其發(fā)布的設(shè)計創(chuàng)新而成立該項目以來,OCP 的發(fā)展情況。

「我們現(xiàn)在取得的進步是值得關(guān)注的,」OCP 項目董事長Jason Taylor 表示,他同時也是Facebook Infrastructure 部門副總裁之一?!窸CP就是一個讓工程師聚在一起,創(chuàng)造驚艷產(chǎn)品的地方?!?/p>

「我感受到了巨大的動力,因為我們超越了超大型主機(hyperscale),還進入了金融和電信領(lǐng)域,」他說。

服務(wù)器:下一代設(shè)計

Facebook 徹底革新了服務(wù)器設(shè)計和基礎(chǔ)設(shè)施,從傳統(tǒng)的雙服務(wù)器處理器轉(zhuǎn)為基于單個英特爾Xeon-D處理器系統(tǒng)芯片(SoC),該處理器耗能更少,還解決了幾個架構(gòu)問題。

The Mono Lacke服務(wù)器的主板裝入到一個叫Yosemite的組裝單位中,Yosemite的每一個滑動單元底架上可以安裝4個SoC,即4個Mono Lake。Facebook 工程師Vijay Rao 和Edwin Smith在Facebook 工程博客上描述了這一新設(shè)計。

「我們就新處理器的設(shè)計與英特爾緊密合作,同時重新設(shè)計自家的服務(wù)器基礎(chǔ)設(shè)施以打造一個滿足我們需求的系統(tǒng),也能為行業(yè)其他公司所廣泛采用?!顾麄冊诓┛椭袑懙??!附Y(jié)果表明,配備更低功耗的CPUs 的單處理器服務(wù)器在網(wǎng)絡(luò)負載上比雙處理器服務(wù)器表現(xiàn)更好,也更適合數(shù)據(jù)中心負載…與此同時,我們重新設(shè)計的服務(wù)器基礎(chǔ)設(shè)施,在同等電源基礎(chǔ)上,容納每個機架雙倍的CPUs數(shù)量?!?/p>

新的設(shè)計提升了處理器和處理器之間、處理器和內(nèi)存之間的通信效率。

「我們將CPU簡化至正好能滿足我們要求,」這兩位工程師表示,「我們移除了QPI鏈接,縮減了英特爾的成本??紤]到我們的服務(wù)器將基于同一的插槽,這也解決了我們NUMA問題。我們將其設(shè)計為整合芯片集的系統(tǒng)芯片,更加簡單。這種接口一致的CPU散熱設(shè)計功耗(TDP)更低。與此同時,我們重新設(shè)計的服務(wù)器基礎(chǔ)設(shè)施,在同等電源條件下,容納每個機架雙倍的CPUs數(shù)量?!?/p>

這使得Facebook制造出一個可以在每個機架上獲得更高性能的服務(wù)器體系結(jié)構(gòu),同時確保每個機柜能量消耗密度保持在11千瓦以下。

強大的人工智能數(shù)據(jù)分析服務(wù)器

Facebook 在會上還分享了GPUs最新進展,近年來,GPU在高性能計算中發(fā)揮了重要作用。GPUs 最初是用于提升桌面PC性能,處理圖形運算,但是現(xiàn)在卻幫助提升全球一些性能最強大的超級計算機。

Facebook 使用GPUs給人工智能和機器學習數(shù)據(jù)分析帶來更強大的計算能力。其人工智能實驗室訓練神經(jīng)網(wǎng)絡(luò)去解決新問題。這就需要強大的計算能力。

「我們已經(jīng)在人工智能技術(shù)方面投入了很多?!笷acebook 工程和基礎(chǔ)設(shè)施(Engineering and Infrastructure)部門 全球老大Jay Parikh說,「目前,人工智能應(yīng)用于Facebook的Newsfeed,幫助我們提供更好的廣告服務(wù)。也能幫助用戶在日常生活中更安全地使用Facebook。」

Big Sur 系統(tǒng)使用了英偉達Tesla 加速計算平臺,擁有8個高性能GPUs,每個功率達300瓦特,在多個PCI-e連接之間靈活配置。Facebook已經(jīng)優(yōu)化了這些新型服務(wù)器的發(fā)熱和功耗控制,使其可以與數(shù)據(jù)中心中配備標準CPU的服務(wù)器協(xié)同工作。

Big Sur 系統(tǒng)優(yōu)化了性能和反應(yīng)時間,幫助Facebook處理更多的數(shù)據(jù),極大地縮短了其訓練神經(jīng)網(wǎng)絡(luò)的時間。

「性能有了極大的提升,」Parikh說,「我們在數(shù)月間就部署了數(shù)千臺這種機器。使得我們有能力將該技術(shù)應(yīng)用于公司更多的產(chǎn)品實例?!?/p>

存儲:Just a buch of Flash

多年來,F(xiàn)acebook已經(jīng)在用閃存來加速服務(wù)器引導驅(qū)動,提升緩存效率。隨著公司基礎(chǔ)設(shè)備進一步擴大規(guī)模,F(xiàn)acebook創(chuàng)造了一種新型「模塊」,在服務(wù)器運算中整合更多的閃存。Facebook已經(jīng)改進了初代開放計算機——即Knox——的存儲驅(qū)動器,使用固態(tài)硬盤(SSDs)取代存儲硬盤存儲(HDDs),存儲單元從磁盤簇(JBOD)轉(zhuǎn)到了閃存簇(JBOF)。

Facebook和英特爾合作開發(fā)這種新型的閃存簇單元,稱之為Lighting,反應(yīng)了使用NVMe帶來了速度提升,NVMe是為SSDs優(yōu)化的高速PCI總線接口。下面我們通過Parikh 在開放計算峰會上展示的幻燈片來看看具體的參數(shù)。

作為一個分散式(disaggregated)存儲設(shè)備,Lightning 支持各種不同的應(yīng)用?!高@為我們正在開發(fā)的應(yīng)用帶來了一個高性能存儲式的新型建造模塊?!筆arikh說。Parikh表示將來會有更多存儲方面的創(chuàng)新,尤其是創(chuàng)新地使用非易失性存儲器(NVM)。

「在存儲行業(yè),磁盤驅(qū)動器還在持續(xù)擴大,但是可靠性和反應(yīng)時間并未變得更好,IOPS (每秒讀寫次數(shù))也沒有提升。」Parikh 表示,「閃存小有進步,但是耐久性也沒有極大地提升。我們陷入這樣一個模式:規(guī)模在不斷擴大,但是從性能的角度看,我們并未獲得真正需要的?!?/p>

Facebook在新型的NVM應(yīng)用方面,尤其是英特爾和鎂光共同開發(fā)的3D XPoint技術(shù),看到了潛在答案。Parikh 呼吁開放計算社區(qū)將重點放在該技術(shù)上,或能解決存儲行業(yè)面臨的挑戰(zhàn)。

Parikh說,我們可以(基于這些選擇,指NVM,F(xiàn)lash等不同技術(shù))開始思考我們的存儲問題,把存儲需求進行分級(按照性能,容量)布局,帶給我們更多的價格和性能杠桿,實現(xiàn)性能或者儲能的拓展,或者對成本進行優(yōu)化。他表示NVM 是介于DRAM 和NAND 之間一個值得關(guān)注的。

Facebook 正在MyRocks開源項目測試NVM 配置,該項目是基于MYSQL和RocksDB 數(shù)據(jù)庫技術(shù)之上。

前路漫漫:為到來的數(shù)據(jù)洪流進行擴展

Facebook不遺余力地推動更快、性能更強的基礎(chǔ)設(shè)施建設(shè)的原因在于用戶增長,目前,F(xiàn)acebook用戶數(shù)達到10.6億、WhatsApp 10億、Facebook Messenger 8億、Instagram 4億。扎克伯格在虛擬現(xiàn)實領(lǐng)域的野心也是推動因素之一,F(xiàn)acebook 20億美元收購虛擬現(xiàn)實先驅(qū)Oculus就是明證。

虛擬現(xiàn)實可提供沉浸式3D體驗,很多分析人士認為,虛擬現(xiàn)實技術(shù)的黃金期即將到來。扎克伯格相信Facebook可賦予其社交網(wǎng)絡(luò)虛擬現(xiàn)實體驗。

「很快,我們將生活在一個人人都可以身臨其境般分享和體驗全部場景的世界,」扎克伯格在近期的世界移動通信大會(MWC)上說?!赶胂笠幌?,你可以在任何時候你都可以坐在篝火前,與朋友待在一起;或者在任何時間都可以與朋友們在私人電影院看電影。想象下在全球任意一個角落開會或舉辦大會。所有這些都將成為現(xiàn)實,這也是為什么Facebook這么早在大力投資虛擬現(xiàn)實,我們真的很希望提供這些社交體驗?!?/p>

這對基礎(chǔ)設(shè)施建設(shè)提出了極高的要求,完整的虛擬現(xiàn)實視頻容量大小是現(xiàn)在的高清視頻的20倍之多。

「超大的文件或成為高質(zhì)量、大規(guī)模地推廣360視頻或虛擬現(xiàn)實的障礙,」Facebook的Evgeny Kuzakov and David Pio 寫道,他們近期概述了虛擬現(xiàn)實文件的解碼和壓縮技術(shù)的進展。Facebook 在360視頻上正從等距柱狀投影布局(equirectangular layouts)遷入使用立方體版式(cube format ),文件大小減少了25%。

但是,F(xiàn)acebook意識到虛擬現(xiàn)實視頻實時推送需要更快的網(wǎng)絡(luò),F(xiàn)acebook無法獨立實現(xiàn)。所以Facebook仿照開放計算的模式,提出了Telecom Infra Project 項目,與Equinix、英特爾、諾基亞、SK電訊、T-Mobile和德國電信共同開發(fā)5G網(wǎng)絡(luò),加速全球網(wǎng)絡(luò)發(fā)展。

「為了迎接全球(視頻和虛擬現(xiàn)實)的數(shù)據(jù)挑戰(zhàn),傳統(tǒng)電信基礎(chǔ)設(shè)施的升級不及人們所需,」Parikh 表示,「對迎接這些新的技術(shù)挑戰(zhàn)、發(fā)現(xiàn)新的機遇來說,加快電信基礎(chǔ)設(shè)施的創(chuàng)新步伐,很有必要?!?/p>

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version