保障數(shù)據(jù)用戶安全和網(wǎng)約車合法既是滴滴出行的機(jī)遇也是挑戰(zhàn)
華信智原《職話大數(shù)據(jù)》欄目對話滴滴出行大數(shù)據(jù)高級(jí)分析師李麗凱,共同探討如何保障網(wǎng)約車平臺(tái)用戶數(shù)據(jù)安全及網(wǎng)約車合法化等話題。李凱麗表示,保障數(shù)據(jù)用戶安全和網(wǎng)約車合法既是滴滴出行的機(jī)遇也是挑戰(zhàn)。
海量數(shù)據(jù)既是機(jī)遇也是挑戰(zhàn)
目前滴滴有超過一千五百萬的司機(jī)和超過三億的注冊用戶,除此之外,滴滴平臺(tái)上每天會(huì)產(chǎn)生超過一千六百萬的訂單,完成這些訂單需要處理超過70TB的數(shù)據(jù),在滴滴的平臺(tái)上每天有超過90億次的路徑規(guī)劃,還有超過十億次的派單。李凱麗表示,這些海量的數(shù)據(jù)對于滴滴來說具有很高的的數(shù)據(jù)價(jià)值。
李凱麗說:“海量數(shù)據(jù)處理的挑戰(zhàn)主要來自于處理大數(shù)據(jù)的運(yùn)算量以及算法。比如說,AlphaGo它下圍棋只需要處理十九乘以十九格的運(yùn)算量,對于滴滴來說,北京市的每個(gè)街道、每個(gè)用戶發(fā)出的訂單、司機(jī)正在街上行徑的軌跡以及兩三秒鐘就會(huì)變更的需求,這些都是增加滴滴運(yùn)算的挑戰(zhàn)?;谶@些挑戰(zhàn),滴滴也吸引了很多世界頂級(jí)人才,包括浙江大學(xué)的何曉飛教授、密歇根大學(xué)終身教授葉杰平教授以及阿里的章文嵩,他們都認(rèn)為海量數(shù)據(jù)運(yùn)算處理非常有挑戰(zhàn),有吸引力。”
李凱麗表示,當(dāng)下,滴滴并不需要進(jìn)行太多基于數(shù)據(jù)的商業(yè)化拓展,滴滴要做好的事情就是出行的匹配,出行的匹配是一個(gè)特別龐大的運(yùn)算量,它需要特別聰明的算法來完成。對于司機(jī)來說,希望滴滴平臺(tái)能夠增加兩個(gè)數(shù)據(jù)指標(biāo),一個(gè)是TPH(trip per hour),還有一個(gè)是IPH(income per hour),分別為每小時(shí)的訂單以及每小時(shí)的收入這兩個(gè)數(shù)據(jù)。
保證數(shù)據(jù)安全原則:用戶第一,體驗(yàn)第二
滴滴對于數(shù)據(jù)保持安全第一體驗(yàn)第二的原則。保護(hù)用戶數(shù)據(jù),在匿名化處理數(shù)據(jù)的前提下,再進(jìn)行一些基于數(shù)據(jù)的應(yīng)用。目前,滴滴和優(yōu)步打破了以往的一個(gè)競爭關(guān)系,以一個(gè)合作的姿態(tài)來共同面對中國的市場。
李凱麗說:“滴滴內(nèi)部對于數(shù)據(jù)的處理一直遵循用戶安全第一體驗(yàn)第二的原則。針對數(shù)據(jù)本身物理存儲(chǔ)的安全問題,滴滴會(huì)提高數(shù)據(jù)安全級(jí)別,使用離線存儲(chǔ);滴滴內(nèi)部還將提升數(shù)據(jù)管理者的安全級(jí)別;此外,滴滴使用匿名化的數(shù)據(jù),這是一個(gè)不可追蹤不可回溯整個(gè)過程,所有參與數(shù)據(jù)的人員,能看到的是一串代碼或是一個(gè)數(shù)字,但是他們并不能把這些數(shù)字反向的追溯到個(gè)人,進(jìn)而從內(nèi)部和外部同時(shí)保證用戶的數(shù)據(jù)安全。”
中國是全世界最大的網(wǎng)約車市場,也給予了網(wǎng)約車合法的地位。合法化對于滴滴來說是一個(gè)非常重要的里程碑。李凱麗說,但滴滴需要解決眾多問題,一方面是出行潮汐的問題,人們出行有特別明顯的潮汐性,早上有早高峰,晚上有晚高峰。在數(shù)據(jù)方面,解決出行潮汐的問題,如何調(diào)節(jié)更好的供給來滿足某個(gè)特定時(shí)間段的需求,用數(shù)據(jù)來滿足潮汐,讓大家可以正常的上下班可以正常的出行。另一方面,滴滴希望做一個(gè)大的出行平臺(tái),這個(gè)平臺(tái)包括專車、快車、出租車以及順風(fēng)車巴士等,用來滿足不同用戶的不同需求。
大數(shù)據(jù)人才培養(yǎng)應(yīng)當(dāng)理論結(jié)合實(shí)踐
李凱麗說:“對于大數(shù)據(jù)人才培養(yǎng)而言,有三個(gè)重要的條件,第一,要采集足夠有效的并且干凈的數(shù)據(jù),進(jìn)行存儲(chǔ)并且能夠安全的應(yīng)用;第二,要有計(jì)算能力,即能夠用JPU來代替CPU處數(shù)據(jù)。第三,要有存儲(chǔ)能力,現(xiàn)在有了云計(jì)算,可以存儲(chǔ)大量的數(shù)據(jù),滴滴每天有70TB的數(shù)據(jù),如果沒有龐大的存儲(chǔ)庫的話,是無法處理的”。
算法就像一個(gè)引擎,不停運(yùn)轉(zhuǎn),數(shù)據(jù)是引擎的燃料,通過燃燒燃料,來讓引擎轉(zhuǎn)的更快,轉(zhuǎn)的更聰敏,轉(zhuǎn)的更智能,進(jìn)而實(shí)現(xiàn)人工智能。李凱麗說,大數(shù)據(jù)人才的培養(yǎng),就是培養(yǎng)精通存儲(chǔ),精通算法,有計(jì)算能力得人才,進(jìn)一步推動(dòng)大數(shù)據(jù)落地的應(yīng)用。
“我自己不涉及招聘團(tuán)隊(duì),我的概念更多來自于何曉飛、葉杰平教授。何曉飛教授認(rèn)為大數(shù)據(jù)人才,應(yīng)當(dāng)有改變世界的心和改變世界的欲望,能夠?qū)?shù)據(jù)作為愛好并且有強(qiáng)烈的好奇心去深入挖掘數(shù)據(jù)的價(jià)值,對一個(gè)具體的事情進(jìn)行一個(gè)改善”李凱麗說。
李凱麗介紹,何曉飛教授在國外待了好多年,回國之后他一直在感嘆,中國的產(chǎn)業(yè)界和學(xué)界的距離比較遠(yuǎn),而斯坦福大學(xué)學(xué)生上學(xué)和創(chuàng)業(yè)是緊密相連的,包括哈佛和麻省理工他們的學(xué)生都會(huì)提早去參與和解決一些企業(yè)的問題,進(jìn)而推進(jìn)自己的研究領(lǐng)域。但是中國的學(xué)校和企業(yè),脫節(jié)的比較厲害,所以國內(nèi)大數(shù)據(jù)團(tuán)隊(duì)的那些leader會(huì)用很多的精力來培養(yǎng)學(xué)生。對于中國來說,一方面,何曉飛希望公司和高校建立更多的合作,科學(xué)家不要待在辦公室里,因?yàn)樗麄兲幚淼臄?shù)據(jù)量非常的少,而企業(yè)有大量的數(shù)據(jù)沒有人來處理,希望企業(yè)和高校能夠建立更多的合作,讓學(xué)生提早接觸到數(shù)據(jù)讓他深入到一線,在處理具體的數(shù)據(jù)當(dāng)中,來進(jìn)一步完善算法。