特斯拉近日宣布其“完全自動(dòng)駕駛”軟件FSD迎來(lái)了最新版本V13.2,并已順利完成首批用戶交付。此次更新亮點(diǎn)紛呈,新增了停車啟動(dòng)、自動(dòng)換擋以及目的地自動(dòng)泊車等功能,進(jìn)一步提升了用戶體驗(yàn)。特斯拉自動(dòng)駕駛工程師Arek Sredzki強(qiáng)調(diào),新系統(tǒng)的端到端網(wǎng)絡(luò)如今能夠直接將乘客從一個(gè)停車位安全送達(dá)至另一個(gè),實(shí)現(xiàn)了P2P(點(diǎn)到點(diǎn))的無(wú)縫銜接。
特斯拉FSD的每次重大更新,總是能迅速吸引國(guó)內(nèi)外智能駕駛領(lǐng)域的廣泛關(guān)注。年初,特斯拉推送FSD V12測(cè)試版時(shí),就將城市街道駕駛的軟件棧革新為單一的端到端神經(jīng)網(wǎng)絡(luò),這一變革如同在平靜的水面投下了一顆巨石,不僅在美國(guó)本土引起了軒然大波,也在遙遠(yuǎn)的中國(guó)掀起了一股端到端技術(shù)的熱潮。
當(dāng)前,眾多致力于在自動(dòng)駕駛領(lǐng)域拔得頭籌的汽車制造商和智能駕駛供應(yīng)商,紛紛將端到端技術(shù)置于其宣傳的核心位置。2024年,多家車企和智能駕駛供應(yīng)商宣稱自己已進(jìn)入“智駕第一梯隊(duì)”,盡管技術(shù)和產(chǎn)品能力各異,但端到端技術(shù)無(wú)一例外地成為了他們的關(guān)鍵詞。
端到端技術(shù)究竟有何魔力,又隱藏著哪些不為人知的秘密呢?從根本上看,端到端與傳統(tǒng)自動(dòng)駕駛算法的主要區(qū)別在于系統(tǒng)架構(gòu)和數(shù)據(jù)處理方式。傳統(tǒng)算法采用模塊化部署,將感知、預(yù)測(cè)、規(guī)劃和控制等功能分割為獨(dú)立模塊,雖然結(jié)構(gòu)清晰,但容易導(dǎo)致誤差累積和信息丟失。而端到端架構(gòu)則將整個(gè)駕駛過(guò)程視為一個(gè)整體,通過(guò)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)模型,直接從傳感器數(shù)據(jù)映射到車輛控制指令,不僅簡(jiǎn)化了系統(tǒng)結(jié)構(gòu),還顯著提高了整體性和穩(wěn)定性。
在實(shí)踐過(guò)程中,行業(yè)內(nèi)部對(duì)于端到端的路徑選擇出現(xiàn)了分歧,主要分為一體化端到端(One Model)和分段式端到端(模塊化端到端)兩種方案。一體化端到端從感知到預(yù)測(cè)規(guī)劃無(wú)縫銜接,確保了信息的完整傳遞,系統(tǒng)響應(yīng)速度更快,但調(diào)試難度較大。分段式端到端則將感知和決策規(guī)劃分開(kāi),并在中間嵌入人工接口,以實(shí)現(xiàn)更靈活和可擴(kuò)展的系統(tǒng)設(shè)計(jì),但可能面臨信息損失和全局最優(yōu)性問(wèn)題。
為了進(jìn)一步提升端到端系統(tǒng)決策的準(zhǔn)確性和靈活性,行業(yè)普遍采用端到端+VLM(視覺(jué)語(yǔ)言模型)架構(gòu)。在這種架構(gòu)下,端到端系統(tǒng)負(fù)責(zé)處理感知、決策和執(zhí)行的全過(guò)程,而VLM作為輔助系統(tǒng),提供對(duì)復(fù)雜交通場(chǎng)景的理解和語(yǔ)義解析。例如,理想汽車的端到端與VLM相結(jié)合的雙系統(tǒng)架構(gòu)方案,就基于人類兩套思維系統(tǒng)理論,旨在賦予車端模型更高的性能上限和發(fā)展?jié)摿Α?/p>
不過(guò),許多專家認(rèn)為,端到端+VLA(視覺(jué)語(yǔ)言動(dòng)作模型)將是端到端+VLM的下一個(gè)發(fā)展階段。VLA將端到端系統(tǒng)與多模態(tài)大模型更徹底地結(jié)合,形成一個(gè)統(tǒng)一的模型框架,能夠更全面地理解和響應(yīng)復(fù)雜的駕駛環(huán)境。元戎啟行CEO周光表示,從VLM到VLA的進(jìn)步,就像是從有人指導(dǎo)的初學(xué)者變成了經(jīng)驗(yàn)豐富的老手直接操作,后者更為先進(jìn)且可靠。
然而,端到端技術(shù)的落地并非易事,其中最大的挑戰(zhàn)之一是對(duì)數(shù)據(jù)的高要求。商湯絕影指出,端到端智駕模型對(duì)于高質(zhì)量數(shù)據(jù)的需求呈指數(shù)級(jí)增長(zhǎng),但目前受限于高階智駕的量產(chǎn)規(guī)模、算力資源,高質(zhì)量駕駛數(shù)據(jù)的獲取難度大、效率低、成本高。為此,商湯絕影發(fā)布了“開(kāi)悟”世界模型,以滿足端到端模型訓(xùn)練和仿真對(duì)于數(shù)據(jù)質(zhì)量的高要求。
蔚來(lái)也在今年的創(chuàng)新科技日上發(fā)布了其智能駕駛世界模型NWM,該模型能夠在短時(shí)間內(nèi)推演出多種可能發(fā)生的場(chǎng)景,并找到最優(yōu)決策。理想汽車則運(yùn)用云端世界模型對(duì)其快慢雙系統(tǒng)進(jìn)行能力的訓(xùn)練和測(cè)試,以加速系統(tǒng)的迭代升級(jí)。
盡管端到端技術(shù)的研發(fā)面臨諸多困難,但眾多企業(yè)仍在積極尋求解決方案。奇瑞汽車副總經(jīng)理兼大卓智能CEO谷俊麗表示,面對(duì)越來(lái)越大的AI模型,企業(yè)需要強(qiáng)大的數(shù)據(jù)、云計(jì)算以及頂級(jí)AI科學(xué)家的支持。奇瑞推出的智駕大模型,也是通過(guò)云端世界模型生成豐富場(chǎng)景,預(yù)計(jì)將在未來(lái)幾年內(nèi)實(shí)現(xiàn)兩段式和一段式端到端方案的量產(chǎn)上車。
隨著端到端技術(shù)的不斷發(fā)展和完善,它將進(jìn)一步推動(dòng)上游工具鏈、芯片等技術(shù)的加速發(fā)展,并提升數(shù)據(jù)和AI人才的重要性。然而,關(guān)于端到端是否就是自動(dòng)駕駛的終極方案,行業(yè)內(nèi)仍存在不同看法。但可以預(yù)見(jiàn)的是,這一輪端到端的技術(shù)競(jìng)爭(zhēng),將推動(dòng)整個(gè)行業(yè)向更加智能化、高效化的方向發(fā)展。