從阿里巴巴的角度,業(yè)界對(duì)俗稱BAT的三巨頭有這樣的認(rèn)知..."/>
ITBear旗下自媒體矩陣:

連破四項(xiàng)世界紀(jì)錄 阿里云重證技術(shù)名

   時(shí)間:2015-10-29 13:57:52 來源:搜狐科技編輯:星輝 發(fā)表評(píng)論無障礙通道

關(guān)于阿里云技術(shù)能力的誤解,很多。

從阿里巴巴的角度,業(yè)界對(duì)俗稱BAT的三巨頭有這樣的認(rèn)知:阿里的運(yùn)營,騰訊的產(chǎn)品,百度的技術(shù)。這種認(rèn)知一度產(chǎn)生了對(duì)阿里云的錯(cuò)誤判斷:阿里云有錢任性,靠的是起步早,規(guī)模大。而讓人一度忽略了阿里云的技術(shù)。

可是,10月28日,Sort Benchmark在官方網(wǎng)站公布了2015年排序競賽的最終成績時(shí)。我發(fā)現(xiàn),阿里云飛天分布式計(jì)算系統(tǒng)在其含金量最高的兩項(xiàng)比賽中,打破全部四項(xiàng)世界紀(jì)錄。

很顯然,并不是阿里云無技術(shù),而是阿里的強(qiáng)運(yùn)營掩蓋了阿里云的強(qiáng)技術(shù)。事實(shí)就擺在那里,你到底要怎么看?

怎么理解SortBenchmark的含金量?

很多人也許有疑問,Sort Benchmark是什么機(jī)構(gòu)?它憑什么可以代表云計(jì)算的技術(shù)能力?

也許你沒聽過Sort Benchmark,但你應(yīng)該了解Jim Gray。

這位1998年圖靈獎(jiǎng)的獲得者,極具傳奇色彩。作為計(jì)算機(jī)的傳統(tǒng)主流方向,數(shù)據(jù)庫只有三位圖靈獎(jiǎng)得主,都是大名鼎鼎的人物,開創(chuàng)了屬于自己的時(shí)代。三巨頭之一的E.F.Codd于2003年逝世,數(shù)據(jù)庫之父Bachman也是早早退休,沒成想碩果僅存的Jim Gray于2007年1月28日早上獨(dú)自乘船離開San Francisco Bay,去一個(gè)叫Farallon小島灑他母親的骨灰,不幸在外海失蹤。

Sort Benchmark,就是是由Jim Gray負(fù)責(zé)主辦和管理的排序基準(zhǔn)評(píng)估比賽。該機(jī)構(gòu)每年都會(huì)舉辦一次排序基準(zhǔn)評(píng)估比賽,被譽(yù)為計(jì)算界的奧運(yùn)會(huì)。所以,很多公司和學(xué)術(shù)機(jī)構(gòu)都會(huì)帶著他們最新的研究成果來參加這個(gè)比賽,以評(píng)估他們的研究成果。

據(jù)了解,Sort Benchmark的排序競賽包含4項(xiàng)比賽,其中GraySort和MinuteSort主要評(píng)測(cè)計(jì)算系統(tǒng)的規(guī)模和效率,是4項(xiàng)比賽中含金量最高的兩項(xiàng)。每一項(xiàng)比賽又分通用目的排序(Daytona)和專用目的排序(Indy)兩個(gè)類別。

根據(jù)Sort Benchmark官方數(shù)據(jù)顯示,阿里云飛天分布式計(jì)算系統(tǒng)分別在GraySort和MinuteSort的兩個(gè)類別中打破世界紀(jì)錄。

簡單描述一下這兩項(xiàng)排序的概念。其中,MinuteSort,比較容易理解,顧名思義,就是看你在一分鐘內(nèi)能排序多大的數(shù)據(jù);GraySort,則是為紀(jì)念Sort Benchmark的發(fā)起者Jim Gray而起的名字,它的目標(biāo)就是評(píng)測(cè)大規(guī)模排序的性能,它的評(píng)測(cè)單位是TB/min。

要知道,排序是最基礎(chǔ)的數(shù)據(jù)算法,能夠反映平臺(tái)的整體計(jì)算性能。Sort Benchmark也是大數(shù)據(jù)處理能力公認(rèn)的標(biāo)準(zhǔn)。過去對(duì)比Spark 和 Hadoop的效能時(shí),就會(huì)在Sort Benchmark上排序的速度最為一個(gè)重要的參照指標(biāo)。

所以,Sort Benchmark的紀(jì)錄,意味著在過去一年里,在數(shù)據(jù)處理的技術(shù)上,阿里云已經(jīng)走到了世界領(lǐng)先的水平。那么,要怎么看阿里云這四項(xiàng)世界記錄的實(shí)際意義呢?

連破世界紀(jì)錄的意義何在?

第一,阿里云得以為公有云再次證名。

在GraySort通用目的排序測(cè)評(píng)中,阿里云以15.9TB/分鐘,將這一排序的紀(jì)錄提升了3倍多。去年的冠軍Apache Spark成績?yōu)?.35TB/分鐘。

去年,Apache Spark基于Spark搭建的系統(tǒng)用了207臺(tái)Amazon EC2上的虛擬機(jī),在23分鐘內(nèi)排序了100TB的數(shù)據(jù)。去年的冠軍Hadoop用了2100臺(tái)Yahoo內(nèi)置的機(jī)器,花了72分鐘,排序速度是Hadoop的三倍。阿里云則讓排序的速度再度快了三倍。

這個(gè)紀(jì)錄的的意義很深遠(yuǎn)。去年Apache Spark,是該比賽歷史上第一次基于公有云的系統(tǒng)獲得了第一。而今年的阿里云也是以公有云系統(tǒng)創(chuàng)造新的記錄,這表示公有云在數(shù)據(jù)處理方面的能力已經(jīng)到了世界最高水平,這等于為公有云再次證名。

第二,技術(shù)流的強(qiáng)強(qiáng)對(duì)話,分量更重。

Sort Benchmark紀(jì)錄最大的價(jià)值,是與世界上最頂尖的技術(shù)公司和機(jī)構(gòu),在統(tǒng)一的標(biāo)準(zhǔn)下強(qiáng)強(qiáng)對(duì)碰,這種紀(jì)錄才是真正的計(jì)算奧運(yùn)會(huì)。

可以看到,在GraySort被阿里云擊敗的公司包括了去年的冠軍Apache Spark。Apache Spark是個(gè)開源和兼容Hadoop的集群計(jì)算平臺(tái)。由加州大學(xué)伯克利分校的AMPLabs開發(fā),作為Berkeley Data Analytics Stack(BDAS)的一部分,由大數(shù)據(jù)公司Databricks擁有。這是全球最有前途的大數(shù)據(jù)技術(shù)公司。

在MinuteSort通用目的排序測(cè)評(píng)中,阿里云飛天的速度為7.7TB/分鐘,擊敗去年速度為3.7TB/分鐘冠軍三星。三星這家酷愛全產(chǎn)業(yè)鏈的公司,對(duì)技術(shù)的投入一直巨大,并在2013年開始進(jìn)軍大數(shù)據(jù)。

另外,在GraySort和MinuteSort的Indy排序中戰(zhàn)勝的都是BAT中,一直享受技術(shù)派名譽(yù)的百度。百度也是國內(nèi)頂級(jí)的數(shù)據(jù)處理公司,大數(shù)據(jù)一直是公司的核心戰(zhàn)略之一。

在強(qiáng)者如林的競爭對(duì)手中,連破四項(xiàng)世界紀(jì)錄,這足以讓業(yè)界對(duì)阿里云的整體印象重新認(rèn)定。阿里云,不僅有阿里巴巴好的資金支持,優(yōu)秀的運(yùn)營團(tuán)隊(duì),更有領(lǐng)先一步的技術(shù)能力。

第三,證明了可以成為DT世界的驅(qū)動(dòng)力

馬云不止一次的提到DT世界,提到阿里是一個(gè)數(shù)據(jù)公司,他甚至認(rèn)為,未來世界,數(shù)據(jù)將取代石油,成為整個(gè)世界的最大能源。

可是,實(shí)現(xiàn)DT世界,需要有兩個(gè)前提。一是大數(shù)據(jù)技術(shù)逐漸成熟,并應(yīng)用于所有行業(yè)。二是數(shù)據(jù)的處理能力,也就是計(jì)算的能力足夠強(qiáng),足夠快。

云計(jì)算作為數(shù)據(jù)世界的根本驅(qū)動(dòng)力,阿里云逐漸成為了馬云實(shí)現(xiàn)DT世界最有力的推手。從年中宣布60億投資阿里云,到連續(xù)兩個(gè)季度財(cái)報(bào)中,阿里巴巴成長最快的業(yè)務(wù)。阿里云,賴以成長的根本,并不僅是資本推動(dòng)的,而是技術(shù)推動(dòng)的。

Sort Benchmark的紀(jì)錄,正從側(cè)面證明了這一點(diǎn),使得讓數(shù)據(jù)的世界,擁有了最快最穩(wěn)定的數(shù)據(jù)處理能力,讓馬云DT世界的目標(biāo),似乎又近了一步。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version