1 月 8 日消息,在 CES 2022 期間,Mobileye 宣布,目前已采集了 200PB 的數(shù)據(jù)。這一龐大的汽車數(shù)據(jù)集包含了過去 25 年中超過 200 PB 的真實環(huán)境駕駛視頻素材,共 1600 萬個 1 分鐘視頻片段。
Mobileye 表示,這些數(shù)據(jù)配合 Mobileye 的計算機視覺技術(shù)和自然語言理解(NLU)模型使用,即使是罕見條件和場景下的“長尾”事件,仍可以在幾秒鐘內(nèi)輸出數(shù)千個結(jié)果。這有助于自動駕駛汽車和計算機視覺系統(tǒng)處理邊緣情況,從而讓自動駕駛汽車實現(xiàn)更高的平均故障間隔時間(MTBF)。
▲ Mobileye 數(shù)據(jù)集
Mobileye 數(shù)據(jù)集由 2500 多名標注人員手動標注或自動標注。該計算引擎依靠云服務(wù)器中的 50 萬個峰值 CPU 內(nèi)核,每月處理 5000 萬個數(shù)據(jù)集 —— 相當于每月處理由 50 萬小時的駕駛素材所生成的 100 PB 數(shù)據(jù)。
Mobileye 團隊使用內(nèi)部搜索引擎數(shù)據(jù)庫,其中包含數(shù)百萬張圖片、視頻片段和場景。內(nèi)容覆蓋面極廣,從“被雪覆蓋的拖拉機”一直到“夕陽下的交通信號燈”,這些均由 Mobileye 采集并饋入其算法。
▲ Mobileye 數(shù)據(jù)集包含數(shù)百萬張圖片、視頻片段和場景