在智能駕駛領(lǐng)域,一場由DeepSeek引領(lǐng)的技術(shù)風(fēng)暴正悄然改變行業(yè)格局。當(dāng)“AI上車”的故事已逐漸失去新意,DeepSeek卻以一種黑馬之姿,震撼了整個智能駕駛產(chǎn)業(yè)。
就在今年1月20日,DeepSeek隆重推出了其DeepSeek-R1模型,并慷慨地開源了模型權(quán)重。憑借其低廉的成本與卓越的性能,DeepSeek在短短7天內(nèi)用戶數(shù)量便突破了1億大關(guān),迅速成為了全球矚目的焦點。
而在多模態(tài)技術(shù)方面,DeepSeek早在2024年12月便已發(fā)布了DeepSeek-VL2模型,這是一款專為高級多模態(tài)理解設(shè)計的專家混合視覺語言模型。該模型在視覺問答、光學(xué)字符識別、文檔/表格/圖表理解以及視覺定位等方面,均展現(xiàn)出了顯著提升的能力。
事實上,在DeepSeek尚未聲名鵲起之時,產(chǎn)業(yè)界便已悄然注意到了其旗下的模型。一些自動駕駛公司更是未雨綢繆,開始探索該模型的應(yīng)用潛力。一位智能駕駛領(lǐng)域的龍頭企業(yè)高管透露:“我們在年初進行了內(nèi)部測試,DeepSeek的表現(xiàn)超乎預(yù)期。它不僅大幅提升了模型訓(xùn)練效率,縮短了推理響應(yīng)時間40%至50%,還降低了算力利用率?!?/p>
業(yè)內(nèi)人士認(rèn)為,作為開源基礎(chǔ)模型的DeepSeek,有望大幅加速智能駕駛的訓(xùn)練速度,并降低訓(xùn)練成本,從而成為智能駕駛訓(xùn)練領(lǐng)域的重要工具。在智能駕駛系統(tǒng)的開發(fā)過程中,復(fù)雜城區(qū)場景一直是個棘手的問題,傳統(tǒng)的感知模型難以應(yīng)對此類長尾場景。因此,各大企業(yè)紛紛嘗試開發(fā)VLM模型(視覺語言模型),以提升系統(tǒng)對長尾場景的檢測及處理能力。
然而,開發(fā)這樣的系統(tǒng)需要巨大的云端算力及數(shù)據(jù)訓(xùn)練成本,部署到車端的模型也需要依賴高性能的硬件平臺。而DeepSeek憑借其獨特的技術(shù)優(yōu)勢,如MoE(混合專家架構(gòu))、GRPO(群組相對策略優(yōu)化)、MLA(多頭潛在注意力機制)等,為智能駕駛系統(tǒng)的開發(fā)提供了有力支持。正如知行汽車科技系統(tǒng)總監(jiān)張偉所言:“DeepSeek有助于我們以更少的數(shù)據(jù)和訓(xùn)練成本,實現(xiàn)同等性能的城市自動駕駛功能?!?/p>
在云端訓(xùn)練環(huán)節(jié),DeepSeek降低了對數(shù)據(jù)標(biāo)注的需求,從而幫助智能駕駛企業(yè)進行數(shù)據(jù)挖掘和生成,降低了數(shù)據(jù)采集和標(biāo)注的成本。而在車端,DeepSeek則通過蒸餾技術(shù)提升模型能力,降低了計算資源需求及部署成本。這不僅降低了模型單次調(diào)用的算力需求,還大幅削減了訓(xùn)練成本。
在場景理解方面,張偉認(rèn)為,經(jīng)過跨模態(tài)遷移后的DeepSeek在邏輯性與場景理解力上更為強大,在極端路況下的表現(xiàn)有望超越傳統(tǒng)模型。黑芝麻智能CMO楊宇欣也表示,未來DeepSeek可以融合視覺、語音、環(huán)境等多維度數(shù)據(jù),實現(xiàn)更加擬人化的駕駛決策。例如,在復(fù)雜路口動態(tài)調(diào)整路徑規(guī)劃,或在突發(fā)狀況中迅速生成安全策略。
楊宇欣進一步指出,DeepSeek等大模型的核心價值在于其端側(cè)高效推理能力,這將推動智能駕駛系統(tǒng)從“感知驅(qū)動”向“認(rèn)知驅(qū)動”升級。若DeepSeek能夠通過低成本算力芯片實現(xiàn)規(guī)模化應(yīng)用,將極大地加速智能駕駛功能向大眾市場的普及。