『引言:AI的浪潮勢不可擋,在無數(shù)大眾最熟悉的生活場景中,其實蘊含著許多未被發(fā)現(xiàn)的秘密。這些“深藏功與名”的AI技術,在最基礎的功能背后,卻演繹著數(shù)據和算法最動人的一面。百度地圖將通過揭秘黑科技一系列專題,講講地圖日常功能背后的技術。
本期內容作為百度地圖“黑科技科普月”系列連載的最后一期,將為你展示百度地圖如何從海量的運動軌跡中獲取信息,生成一份高效準確的“活地圖”,讓數(shù)千萬用戶的導航路線更加精準?!?/p>
有種無奈叫做“車到山前竟無路”,每一次走了冤枉路,都忍不住感嘆地圖的時效性有多么重要!如何跟得上千變萬化的路況,在地圖上及時反映道路變動,讓用戶少走冤枉路?百度地圖從車輛運行軌跡發(fā)現(xiàn)線索,實現(xiàn)數(shù)據更新的方式,或許是解決這個問題的最好答案。
數(shù)據挖掘:從海量軌跡中“發(fā)現(xiàn)線索”
提起地圖的數(shù)據更新,傳統(tǒng)方式分為采集車采集和用戶端標注兩種。但若要實現(xiàn)實時的數(shù)據采集更新,對純人工作業(yè)來講相當辛苦,幾乎等于不可能完成的任務。因此,百度地圖利用AI算法能力,每分每秒從萬千車輛運行軌跡的大數(shù)據中,提煉出有效信息進行分析,最終實現(xiàn)數(shù)據的實時更新。那么,具體是怎樣做到的呢?
軌跡投影到地圖上的呈現(xiàn)結果
一般來講,我們將軌跡定義為“空間位置點連成的序列”,因此如果一條道路上出現(xiàn)了大量車輛行駛的軌跡,則將有大量的軌跡投影到地圖上,結果就將呈現(xiàn)出如上圖一樣顏色深淺不一的線條。顏色越深的地方,說明軌跡越多。此時,百度地圖就可以根據“是否持續(xù)有軌跡出現(xiàn)”來做出基礎性判斷,分析一條路是否存在或消失。
在此之前,需要先提取軌跡的特征進行初步判斷。以長度特征為例,若一段軌跡長度為100KM,更可能是汽車走的;若軌跡長度為100M,則不太好判斷,需要以此類推,用不同特征進行多輪初步判斷。其次,要把軌跡對應到現(xiàn)有道路數(shù)據上,這一環(huán)節(jié)被稱之為“地圖匹配”。由于在現(xiàn)實生活中,一個人不可能瞬間從一條路切換到另一條路上,因此可以借助“序列解碼算法”來實現(xiàn),將紛繁復雜的定位點一一匹配。
地圖匹配示意圖
模型分析,深入研究做出精準判斷
完成“地圖匹配”這一環(huán)節(jié)后,就可以進一步判斷道路是否能夠通行。如圖所示,北京市萬泉河匝道原本處于施工狀態(tài),2018年6月28日,百度地圖監(jiān)測到附近出現(xiàn)了大量新軌跡,便基于軌跡的速度分布,進行機器分類,判斷出這條軌跡是由汽車行駛產生的。同時將軌跡的坐標點做地圖匹配,確定這些軌跡是在施工道路上產生的。再根據呈分散狀態(tài)的軌跡終點,判斷出產生軌跡的車輛并非施工車輛,而是正常的社會車輛。至此,基本就可以認定出,這條施工路段已經可以通行了。
通行狀態(tài)判斷
除了常規(guī)的通行狀態(tài)判斷之外,百度地圖還能基于對軌跡特點的研究,判斷出是否存在了時段性交規(guī)。如在某一時段中,路段的軌跡數(shù)量驟然下降,之后又驟然提升。但當?shù)卣w出行需求并未出現(xiàn)這樣的情況。所以軌跡下降很可能是人為限制造成的,又由于發(fā)生突變的時間點非常的整齊,從而可以推測,此處很可能有一個僅在14點-16點期間禁止通行的分時段交規(guī)。
基于時間進行通行狀態(tài)判斷
通過軌跡處理,百度地圖以分鐘級的速度,每天更新上萬條道路的通行狀態(tài),讓千萬用戶的導航路線更加精準。當用戶開車時收到百度地圖“送上”的溫馨提醒后,發(fā)現(xiàn)一條原本需要繞行的路已經開通了,相信也會進一步感知到百度地圖用AI為用戶帶來的切實福利。
百度地圖“黑科技科普月”系列至今已畫上句號,通過接連5期的內容,我們?yōu)楣娊沂救粘9δ鼙澈蟮募夹g支柱,并進一步解讀日常中觸手可及的智能生活從何而來。百度地圖作為出行行業(yè)的領導者,每時每刻都在為用戶的出行“保駕護航”。AI不斷進化,下一個篇章中百度地圖與AI的故事,又將是值得期待的新時代盼望。