于2014年3月10日啟動報名的首屆阿里巴巴大數(shù)據(jù)競賽開賽一個月以來,報名隊伍數(shù)突破6400支,已經(jīng)成為目前全球最大的算法類競賽之一。截止4月10日,阿里巴巴大數(shù)據(jù)競賽總參賽人數(shù)近1.5萬人。其中港澳臺參賽隊伍超過120支,海外隊伍超過80支。
此前,從1997年開始已舉辦了15屆的KDD CUP一直以來是世界范圍內(nèi)最大規(guī)模的數(shù)據(jù)競賽,該競賽依附于美國計算機協(xié)會數(shù)據(jù)挖掘及知識發(fā)現(xiàn)專委會主辦的ACM SIGKDD國際會議(簡稱KDD)。作為數(shù)據(jù)挖掘研究領(lǐng)域的頂級年會,2012年的KDD CUP數(shù)據(jù)競賽曾經(jīng)吸引了國內(nèi)隊伍參加,但全球范圍內(nèi)參加的隊伍數(shù)不超過1000支。
據(jù)悉,阿里巴巴大數(shù)據(jù)競賽是由阿里巴巴集團主辦,在阿里巴巴大數(shù)據(jù)科研平臺——“天池”上開展的,基于天貓真實推薦業(yè)務(wù)場景與海量真實用戶的訪問數(shù)據(jù)的推薦算法大賽。整個競賽過程持續(xù)九個月,將于十一月中旬結(jié)束。參賽選手不僅可以通過大賽接觸到真實的天貓用戶行為數(shù)據(jù),還有機會被邀請到天貓,與天貓推薦算法團隊的工程師們一起設(shè)計雙11的個性化推薦產(chǎn)品。
阿里巴巴天池項目負責(zé)人王一婷對面向?qū)W術(shù)界免費開放天池平臺的目的解釋說,目前高校和科研機構(gòu)在使用數(shù)據(jù)時,往往面臨兩個困擾,一是數(shù)據(jù)陳舊不鮮活,缺乏有價值的真實的商業(yè)數(shù)據(jù),二是缺乏具有強大功能的計算平臺來支持復(fù)雜的數(shù)據(jù)處理。天池平臺將向?qū)W術(shù)界提供免費的科研數(shù)據(jù)和開放數(shù)據(jù)處理服務(wù),幫助大數(shù)據(jù)科研領(lǐng)域的發(fā)展。“我們搭建一個大數(shù)據(jù)科研平臺,并向科研界提供數(shù)據(jù)和計算服務(wù),在有安全措施保障的情況下,讓學(xué)術(shù)界神樣的理論與工程界的實際應(yīng)用產(chǎn)生碰撞、擦出火花,促進大數(shù)據(jù)科研的發(fā)展——這個平臺就叫做天池平臺”,王一婷表示。
據(jù)介紹,阿里巴巴天池平臺是基于阿里集團自主研發(fā)的ODPS海量數(shù)據(jù)離線處理服務(wù)的大數(shù)據(jù)開放平臺,向?qū)W術(shù)界免費提供科研數(shù)據(jù)和開放數(shù)據(jù)處理服務(wù)(Open Data Processing Service, 簡稱ODPS)。ODPS以RESTful API的形式提供針對PB級別數(shù)據(jù)的批量處理能力,主要應(yīng)用于數(shù)據(jù)分析、海量數(shù)據(jù)統(tǒng)計、數(shù)據(jù)挖掘、商業(yè)智能等領(lǐng)域。