【ITBEAR】在自動駕駛技術(shù)快速發(fā)展的當(dāng)下,關(guān)于“端到端大模型”的討論愈發(fā)激烈。然而,這一概念并非簡單地將端到端與大模型相結(jié)合,而是涉及兩個截然不同的技術(shù)領(lǐng)域。本文將深入探討端到端與大模型的區(qū)別,以及它們在自動駕駛系統(tǒng)中的應(yīng)用。
端到端方案與傳統(tǒng)分模塊方案形成鮮明對比。傳統(tǒng)方案依賴規(guī)則與算法,分為感知、決策、執(zhí)行三模塊;而端到端方案則全面AI化、模型化,消除了模塊間的界限。
與端到端相對,大模型則代表了AI從判別式向生成式的轉(zhuǎn)變。判別式AI基于訓(xùn)練數(shù)據(jù)集學(xué)習(xí)決策邊界,而生成式AI則估計數(shù)據(jù)分布,側(cè)重生成新數(shù)據(jù)。
在自動駕駛領(lǐng)域,車企和供應(yīng)商正積極探索生成式AI大模型的應(yīng)用,以解決傳統(tǒng)端到端方案無法克服的挑戰(zhàn),如復(fù)雜道路拓?fù)?、無視規(guī)則的交通參與者等。
蔚來、小鵬、理想等車企已紛紛將生成式AI大模型融入自動駕駛系統(tǒng)。蔚來汽車的世界模型、小鵬的XBrain模塊以及理想的視覺語言模型,均展示了各自的技術(shù)特色。
其中,蔚來汽車的世界模型尤為引人注目,其基于車端傳感器數(shù)據(jù)推演駕駛場景,選擇最佳行駛軌跡,體現(xiàn)了三維空間智能的應(yīng)用。
小鵬和理想則更注重一維文本智能,通過大語言模型提升對交通參與者意圖和交通標(biāo)識的理解能力。
隨著技術(shù)的不斷進(jìn)步,端到端大模型在自動駕駛領(lǐng)域的應(yīng)用將更加廣泛,為自動駕駛技術(shù)的未來發(fā)展注入新的活力。