12 月 26 號,理想汽車CEO李想在 2024 理想AI TALK活動(dòng)中回答了自己對AI人工智能、自動(dòng)駕駛等問題的見解和判斷。并將在 12 月 31 號全量推送OTA7.0,此次的焦點(diǎn)是高速城市全場景智駕升級端到端+VLM。
李想認(rèn)為,端到端+VLM是他們有望實(shí)現(xiàn)L3 級輔助駕駛的必要過程,但實(shí)現(xiàn)L4 需要 500 萬輛以上車型的海量數(shù)據(jù),再掌握VLA基礎(chǔ)模型的能力,以及大量的人力、物力消耗才有機(jī)會(huì)。
無獨(dú)有偶,三個(gè)月前的全球智能汽車產(chǎn)業(yè)大會(huì)(GIV2024)上,元戎啟行CEO周光就透露了下一步迭代的路線——元戎啟行正基于端到端模型和Thor芯片進(jìn)行VLA模型的研發(fā)工作,并預(yù)計(jì)將于明年推出。元戎啟行也將成為業(yè)內(nèi)首批使用Thor的公司之一。
前不久,周光在專訪中對端到端+VLM模型迭代到VLA模型做了形象的解釋:“端到端+VLM模型就像學(xué)員配教練,教練不能直接操控車,只能通過語言指揮學(xué)員,難免出現(xiàn)來不及說清路況等情形。而VLA模型就像是教練自己在開車,會(huì)更加熟練?!?/p>
他對這次迭代也進(jìn)行了解釋:“VLA模型直接把VLM和端到端智駕模塊合二為一,傳感器數(shù)據(jù)進(jìn)入這個(gè)VLA模型,直接輸出駕駛軌跡給控制系統(tǒng)?!碑?dāng)VLA模型上車后,可實(shí)現(xiàn)百公里接管 1 次,還會(huì)有AI安全兜底措施,將會(huì)成為新的AEB。
除了英偉達(dá)Thor芯片提供的算力支持,數(shù)據(jù)也是VLA模型成功與否的關(guān)鍵,“一個(gè)智駕公司至少要交付上萬輛,才能做端到端1.0(端到端+VLM),而想要做到一個(gè)模塊的VLA架構(gòu),則需要 10 萬輛級的量產(chǎn)車才行?!?/p>
彼時(shí),元戎啟行搭載的量產(chǎn)車規(guī)模已超 30000 臺(tái),僅 12 月,全新藍(lán)山就達(dá)到 8057 輛,同比增長214.24%!同時(shí)在接觸的量產(chǎn)項(xiàng)目已超過 10 個(gè),年底前至少會(huì)有三款搭載元戎啟行智駕系統(tǒng)的車輛進(jìn)入市場。
對于VLA模型他充滿信心:“我覺得是讓這個(gè)系統(tǒng)有更長時(shí)間的推理能力,以及讓系統(tǒng)的可解釋性更強(qiáng),提升還是蠻大的。”
與此同時(shí),商湯絕影CEO王曉剛也表達(dá)了對VLA技術(shù)的認(rèn)可,但認(rèn)為端到端技術(shù)的發(fā)展還需要經(jīng)歷一個(gè)逐步成熟的過程,包括基礎(chǔ)設(shè)施的完善、數(shù)據(jù)的積累與仿真等。
相較于傳統(tǒng)的通過制定規(guī)則訓(xùn)練的模型,VLA模型內(nèi)核是AI神經(jīng)網(wǎng)絡(luò),AI屬性更強(qiáng),性能天花板更高,多位業(yè)內(nèi)人士均判斷VLA模型是未來智駕發(fā)展的大方向。
毫無疑問, 2025 年汽車行業(yè)將開啟“智能化”競爭的下半場。無論是理想的端到端+VLM、元戎啟行的VLA,抑或是小鵬、商湯等,都已經(jīng)在智能化上明確了技術(shù)路線和布局。而那些沒能贏在起跑線的同行們,更要加緊步伐,給自己爭取一個(gè)留在牌桌的機(jī)會(huì)。
(推廣)