特斯拉FSD核心架構(gòu)曝光,技術(shù)路線引熱議
特斯拉又進(jìn)行了技術(shù)分享,在計(jì)算機(jī)視覺頂會(huì)ICCV(International Conference on Computer Vision)上曝光了FSD的核心架構(gòu),其中一個(gè)細(xì)節(jié),引發(fā)行業(yè)猜想特斯拉也在用VLA。VLA和世界模型,2025年最具話題度的技術(shù)路線之爭,難道終于有來自馬斯克認(rèn)可的答案了?
特斯拉也在用VLA?
特斯拉自動(dòng)駕駛副總裁阿肖克·埃魯斯瓦米(Ashok Elluswamy)近期在ICCV期間發(fā)表了題為《在特斯拉構(gòu)建機(jī)器人基礎(chǔ)模型》(Building Foundational Models for Robotics at Tesla)的主題演講。

這是時(shí)隔3年后,特斯拉首次對(duì)外公開分享技術(shù)。上一次是2022年的特斯拉AI Day,當(dāng)時(shí)埃魯斯瓦米也參與了分享,提出占用網(wǎng)絡(luò)新范式,引領(lǐng)了行業(yè)變革。
不過這一次分享的內(nèi)容暫時(shí)還未公開,只流出了一張PPT,但信息量很大,引發(fā)了廣泛討論。

從模糊的圖像中可以看到,這頁P(yáng)PT的標(biāo)題是《可解釋性和安全性保證》,都是目前自動(dòng)駕駛的重要議題。
圖像下方展示了FSD的核心架構(gòu),目前FSD已經(jīng)被整合為了一張大型神經(jīng)網(wǎng)絡(luò),可以輸入多模態(tài)信息,圖中涉及到的有攝像頭視頻、導(dǎo)航信息、自車運(yùn)動(dòng)狀態(tài)和聲音。
輸出端則包括了全景分割信息、3D占用網(wǎng)絡(luò)、3D高斯渲染、語言以及特斯拉以省略號(hào)代替不想透露的輸出信息,最終匯總經(jīng)過推理后輸出動(dòng)作。
這張圖顯示和隱含的信息,與中國玩家當(dāng)前的一些認(rèn)知不謀而合,主要有兩點(diǎn)。
VLA與世界模型之爭,邁向大模型階段
首先,特斯拉當(dāng)前的架構(gòu)最終輸出了語言信息,引發(fā)很多人猜想。今年行業(yè)除了在傳感器選型上有分歧之外,在軟件算法路線上也出現(xiàn)了新的爭論,即VLA和世界模型之爭。
前者以元戎啟行和理想為代表,后者以華為和蔚來為代表,也有一些玩家認(rèn)為應(yīng)該將兩者結(jié)合。
VLA玩家認(rèn)為,該范式一方面可以應(yīng)用互聯(lián)網(wǎng)已有的海量數(shù)據(jù),積累豐富常識(shí),進(jìn)而理解世界。另一方面模型通過語言能力實(shí)際上是具備了思維鏈能力,能夠理解長時(shí)序數(shù)據(jù)并進(jìn)行推理。

甚至有從業(yè)者表示個(gè)別不走VLA路線的玩家,是因?yàn)樽陨砣狈Υ笏懔π酒?yīng),進(jìn)而無法搭載大模型。
世界模型玩家們則堅(jiān)持世界模型更接近問題本質(zhì),華為車BU CEO靳玉志認(rèn)為“VLA這樣的路徑看似取巧,并不能真正走向自動(dòng)駕駛”。
知名AI科學(xué)家、蔚來智能駕駛副總裁任少卿近期在采訪中也表示,世界模型在時(shí)空認(rèn)知能力上比VLA具有“更高的帶寬”,也就是能識(shí)別和利用更多的信息。
不過他也認(rèn)可當(dāng)前語言很重要,在數(shù)據(jù)訓(xùn)練、邏輯推理和人機(jī)交互上有很大價(jià)值。
回到特斯拉的曝光信息來看也是如此,語言在自動(dòng)駕駛中有很重要的應(yīng)用。有人據(jù)此認(rèn)為,特斯拉也在使用VLA技術(shù),但也有人表示這可能只是特斯拉識(shí)別到了道路上的標(biāo)識(shí),然后將其轉(zhuǎn)化為了語言。你怎么看?歡迎在評(píng)論區(qū)討論。
其次,綜合當(dāng)前曝光信息來看,特斯拉FSD已步入大模型階段,而且參數(shù)規(guī)模仍在擴(kuò)大。此前元戎啟行在VLA發(fā)布會(huì)就認(rèn)為,行業(yè)當(dāng)前已進(jìn)入大模型時(shí)代。更大參數(shù)量的模型,需要更大算力芯片支撐,所以今年二十萬級(jí)以上涌現(xiàn)了很多1000TOPS甚至2000TOPS的新車。
特斯拉即將上車的新一代智能輔助駕駛芯片,據(jù)說算力也將直奔2000TOPS,模型參數(shù)也將提高十倍,算法能力值得期待。
或許是對(duì)未來能力足夠自信,近期FSD重啟了激進(jìn)模式。
FSD最新更新:有這些變化
FSD推送了V14.1.3版本,更新多達(dá)10項(xiàng),更安全更有“人味兒”了。
安全性方面,優(yōu)化了遇到細(xì)小障礙物,比如樹枝、輪胎和箱子等的橫向避讓能力。面對(duì)無保護(hù)轉(zhuǎn)彎、變道和車輛加塞,處理得也更好。
前置攝像頭自清潔功能更加快速高效,如果前擋風(fēng)玻璃上有殘留物影響到了前置攝像頭可見度,現(xiàn)在會(huì)發(fā)出警報(bào),你可以聯(lián)系服務(wù)部門。
個(gè)性化方面,開車前你可以通過速度配置文件,更細(xì)化定制你的駕駛偏好。FSD在路上遇到特種車輛,像警車、救護(hù)車和消防車增加了靠邊停車或讓行的動(dòng)作。
如果遇上了堵車,現(xiàn)在FSD的神經(jīng)網(wǎng)絡(luò)中添加了導(dǎo)航和路線功能,能夠?qū)崟r(shí)處理并生成繞行路線。
到達(dá)終點(diǎn)后,你還可以選擇停車位置,比如停在路邊還是進(jìn)入停車場(chǎng)。
在這個(gè)小版本更新幾天前,F(xiàn)SD還重啟了瘋狂麥克斯模式(Mad Max Mode),整體駕駛風(fēng)格很激進(jìn),有車主分享的視頻片段顯示,F(xiàn)SD在該模式下帶著他在晚上的洛杉磯車流中閃轉(zhuǎn)騰挪,瘋狂變道加塞,看上去比開直升機(jī)的通勤效率都高。

埃魯斯瓦米看到后也推薦了兩個(gè)該模式適用的場(chǎng)景,比如說你快趕不上飛機(jī)了,或者說著急接孩子放學(xué)。

埃魯斯瓦米本人的社交平臺(tái)更新,停留在ICCV演講的前一天,所以在占用網(wǎng)絡(luò)和端到端后特斯拉FSD V14如今用了什么魔法,還是未解之謎。
已知的是,特斯拉不再對(duì)外分享后,中國玩家仍然在持續(xù)突破,不管是VLA還是世界模型,都是在無人區(qū)探索。
即便特斯拉選擇了其中一個(gè)方向,也不代表這就是標(biāo)準(zhǔn)答案,正如何小鵬所說,“實(shí)際上,國內(nèi)任何一家有實(shí)力AI玩家,早就不care馬斯克在做什么了”。
車輛本體告別BBA崇拜后,中國自動(dòng)駕駛算法,也正在告別特斯拉崇拜。
本文來自微信公眾號(hào)“智能車參考”(ID:AI4Auto),作者:一凡 ,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com


