今天智能駕駛的發(fā)展節(jié)奏,幾乎所有從業(yè)者都未預料到。
2022年底,在蔚來智能駕駛研發(fā)副總裁任少卿的判斷里,城區(qū)NOA(領航輔助駕駛)的規(guī)模鋪開,需要挨個開城。
但進入2023年,一下子就要“全國都能開”。始作俑者是華為。甚至華為提出的“全國都能開”,也是在同行不斷加碼開城目標后,被動做出的調整。
智能駕駛是嫁接在智能汽車核心屬性中的技術變量,它被認為是最大勢能的變革之一。在各家車企的落地節(jié)奏中,自然寸步難讓。
但可能少有人料到,是蔚來緊跟華為,把“全國都能開”的高階智駕交付給用戶。去年開始,華為喊出智駕“全國都能開”,不斷刺激著同行的神經。蔚來智駕則相對低調,鮮少參與開城數(shù)字交鋒。
今年開始,蔚來智駕風格突變,斗志拉滿。
按照蔚來的計劃,將于4月30日開啟全域領航輔助NOP+全量推送。不僅成為華為之后,第二家交付全域領航輔助駕駛的車企,從用戶推送規(guī)模看,也是目前體量最大的一家,超20萬量級。
蔚來節(jié)奏激變是如何發(fā)生的?
數(shù)日前,36氪在北京見到了蔚來智能駕駛研發(fā)副總裁任少卿。近3個小時交流中,任少卿分享了智駕工程、技術和安全等問題,以及對端到端自動駕駛、世界模型等前沿技術的洞察。

蔚來智能駕駛研發(fā)副總裁任少卿
2020年8月加入蔚來前,任少卿已經是計算機視覺領域的風云人物。其畢業(yè)于中國科大與微軟亞洲研究院聯(lián)合培養(yǎng)博士班,2016年曾獲得全球計算機視覺頂級會議CVPR 最佳論文獎。畢業(yè)后還參與創(chuàng)立智能駕駛公司Momenta,擔任研發(fā)總監(jiān)。
然而,智駕量產之路荊棘遍地。雖然投入重資,蔚來直到2023年才發(fā)布全域領航輔助NOP+功能。質疑伴隨著蔚來智駕團隊。
任少卿說,蔚來有自己的邏輯和節(jié)奏,“我們習慣于把基礎的東西先做完”。團隊除了經歷早期4顆Orin芯片的域控制器控選型,還重寫了軟件架構。2022年,任少卿判斷,智駕必然會從高速走向城區(qū),因此帶領團隊開始部署兼容城市場景的算法架構,“我們不是第一個推出城區(qū)智駕功能的公司,但是第一個城區(qū)技術架構上車的”。
蔚來CEO李斌為團隊構建了以汽車工業(yè)為基礎的認知邏輯,即圍繞“十幾年車輛生命周期”做技術布局。
蔚來的思路是,智駕軟件至少做到10年更新,三代軟件同架構,硬件起碼要保證6-7年的最佳體驗。
蔚來在二代平臺車型標配4顆英偉達Orin芯片,整車AI算力1016 Tops。蔚來的堅持一度被質疑,畢竟同行普遍采用2顆Orin方案,即便蔚來第3顆Orin作為系統(tǒng)冗余,仍有1顆Orin“賦閑”。
但在蔚來的技術體系下,節(jié)奏突變的關鍵,也是找到了第4顆Orin的用武之地,跑出“群體智能”路線。
2023年9月,任少卿和智駕團隊定下目標,在今年二季度完成60萬公里城市道路驗證。
行業(yè)普遍的做法是,自建測試車隊,即一城城驗證后開通路線。但結合群體智能,蔚來可以通過每臺量產車的1顆Orin算力,乘以規(guī)模數(shù)量,得以驗證道路的智駕功能是否可用。這超出蔚來意料,原定9個月的才能完成任務,實際只用了3個多月。
蔚來智駕開始“狂飆”。任少卿表示,目前每月的道路驗證里程達數(shù)千萬公里,蔚來智駕已經在全國726個城市鋪開。
在任少卿看來,在整個智能駕駛的技術落地背后,根基是安全。
蔚來推送全域領航輔助駕駛的一個核心標準,就是事故率低于人類開車,未來2-3年,蔚來還計劃將事故率降低30%乃至更低。
為了減少事故風險,蔚來選擇了一條枯燥的道路:分析用戶的所有智駕接管數(shù)量。“每天可能達幾百萬次。”第4顆Orin可以篩掉99%無用數(shù)據(jù),再經過復雜流程,得到萬分之一安全接管案例,回傳至云端。此外,蔚來還能通過ADAS(輔助駕駛)和ADMS(增強型駕駛員感知系統(tǒng))等系統(tǒng)精準地提醒用戶,減少事故發(fā)生。
技術演進方面,“端到端”被視為智駕行業(yè)下一代方案。
據(jù)任少卿介紹,蔚來的端到端智駕方案是將感知模型與規(guī)控模型合并,實現(xiàn)信息無損傳遞。當前行業(yè)各家基本都在構建感知大模型與規(guī)控大模型。
大模型化很重要的一點是,讓智駕擁有更強的預測能力。就像大語言模型ChatGPT能夠預測下一個字詞,智駕也要具備對物理世界的時空認知能力,認識“路面下雨會打滑”等物理規(guī)律。
這背后是更龐大的世界模型。去年中,蔚來開始探索機器人世界模型,目前已有階段性成果,端到端方案也將在年內發(fā)布。
任少卿認為,機器人世界模型的建立強依賴于機器硬件如智能汽車、機器人等。而這些硬件生產與供應鏈能力,恰恰是中國公司的強項。這也是車企做世界模型的優(yōu)勢所在。“車企一定會是真實世界中領先的人工智能企業(yè)。”
以下是36氪汽車與蔚來智能駕駛研發(fā)副總裁任少卿的對話,經編輯:
「談城區(qū)智駕:華為教會了大家打“心智戰(zhàn)”」
36氪汽車:從競爭角度來看,大家加快開城速度與華為有關系嗎?
任少卿:華為教會了行業(yè)怎么打心智戰(zhàn)。智駕的使用和熟悉成本確實比較高,像座椅電視這種,10秒鐘搞不明白,一分鐘總搞明白了。但智駕說不清楚,一些測試和試駕最少得跑兩三個小時。華為讓消費者認知到了智駕。
36氪汽車:“全國都能開”對于智駕行業(yè)有什么特別的意義?
任少卿:自動駕駛每年都有熱詞,2022年的BEV(鳥瞰圖),2023年Occupancy Network(占用網絡),今年的全國開城、端到端大模型。對于頭部玩家,今年上半年開城就會進入尾聲。
城區(qū)智駕屬于高端功能,但其實智駕還有兩條線,往下走,做好更便宜的方案;往上走,探索L3級自動駕駛,法規(guī)、保險全部都要跟上。
36氪汽車:智駕功能之前是按城市是挨個驗證的,現(xiàn)在明顯感覺大家都來不及了,這對你們的價值觀來說有挑戰(zhàn)嗎?
任少卿:之前大家不太理解我們的邏輯,最近逐漸有一些理解了。
我是2020年下半年加入蔚來,那時候正好是設計第二代平臺。第一個不被理解的問題是,為什么把激光雷達裝到頭頂?
它確實挑戰(zhàn)了很多傳統(tǒng)車的設計語言,內部設計同學一開始也很難受。
這其實是基于我們的認知。激光雷達裝在車頂比裝在車前感知更遠,泥點子、灰塵影響更小、維修成本更低,還不容易被撞到,對用戶價值更高。
斌哥(蔚來CEO李斌)就去溝通造型設計的同事,他說這是挑戰(zhàn),也是個機遇,這是之前沒有過的設計語言,如果做得足夠好,可能會引領一個時代。
現(xiàn)在已經有很多車的激光雷達裝在車頂,但細看,整體協(xié)調性和流線感還比不上蔚來的設計。
第二個被詬病的是4顆英偉達Orin芯片。但換個角度,大多數(shù)人的車怎么也得開個5-10年。Orin是2022年下半年量產,Thor(英偉達下一代芯片)明年量產,三年換代,難道三年也要換車嗎?
芯片行業(yè)變化很快。從2017-2018年到現(xiàn)在,算力變化百倍千倍。Mobileye 的EyeQ4是2018年量產,算力2.5 Tops,但2022年的Orin算力254 Tops了,100倍差距。如果到2025年Thor量產,6年時間算力上漲500倍。
所以軟硬件設計平臺生命周期要足夠長,這對用戶的長期持有是最有價值的。我們想做到軟件更新10年,三代軟件同架構,硬件上要做到兩代,6-7年時間。
36氪汽車:所以李斌的邏輯還是從汽車工業(yè)出發(fā),不是消費電子?
任少卿:他考慮的是生命周期。車不是手機,不能一年一換,要看10年-15年。消費者買的時候可能加了一些錢。30萬以上的車加3%成本,總比三年換一輛車成本低得多。
今年,能實現(xiàn)城區(qū)智駕的車,ET7是最老的一輛。很多比它晚上市的車,都做不了城區(qū)智駕。
36氪汽車:蔚來全量推送的標準是什么?
任少卿:我們的紅線的是,全域領航功能的安全性一定要比人開要好。不管是全域智駕開放,還是車輛使用全生命周期,我們都希望能夠減少事故。
減少事故,涉及到一個非常復雜的系統(tǒng)。首先要知道有沒有事故?這不是一件容易的事。像氣囊炸了這種很容易監(jiān)控,但有些剮蹭,用戶自己可能都不知道,也不知道別人蹭了你還是你蹭了別人。
我們從去年中開始建系統(tǒng),一開始用氣囊、IMU(慣性傳感器)的數(shù)據(jù),但都很難判斷,后面把視覺和Occupancy(占用網絡)加入進來做剮蹭判斷。
36氪汽車:很多時候是車輛快要蹭到了,用戶安全接管,這種也會納入數(shù)據(jù)分析嗎?
任少卿:會有。冰山上的問題永遠是小的,還需要看冰山下面的數(shù)據(jù)。所以我們建了第二套系統(tǒng),分析所有接管。這是什么概念?一天幾百萬次接管,包括高速NOA的接管。這是一個更復雜的系統(tǒng)。因為數(shù)據(jù)量太大,可能都沒有辦法回傳。
怎么辦?群體智能。比如100公里接管了10次,車端一顆Orin可以篩掉99%不是安全接管的案例,剩下1%的安全性接管,再經過一個復雜自動化流程,再篩掉99%,得到萬分之一的案例。所以其實是兩個指標,真實事故和潛在事故。
36氪汽車:數(shù)據(jù)分析完了,怎么減少事故率?
任少卿:所以這是一套多級體系。第一級是基礎功能加強,比如用OCC(占用網絡)、激光雷達等增強對安全接管的分析。
然后是功能級警報。我們有兩套系統(tǒng),ADAS(輔助駕駛)和ADMS(增強型駕駛員感知系統(tǒng))。之前駕駛員的監(jiān)測邏輯是,用戶可能不處于緊張狀態(tài),DMS也會做提醒,但現(xiàn)在我們車內外傳感器都融合,判斷風險場景的出現(xiàn),更多信息輸入,可以更精準地提醒。
我們還做了另一套系統(tǒng),智駕分數(shù)。結合我們的事故分析,會發(fā)現(xiàn)低分用戶與高分用戶的事故率差8倍以上。低分數(shù)用戶的事故率較高。高分用戶能開的智駕功能或者小路就會多一些,低分用戶可能在主干道上用智駕更安全。
36氪汽車:智駕全國都能開在二季度推送,這個決策是什么時候做的?
任少卿:可能就今年年初。一方面是,我們原定60萬公里可能要9個月才能完成,就是去年9月到今年6月,但我們發(fā)現(xiàn)去年12月就已經差不多了,用戶熱力道路都搞完了。剩下的就是,解決安全和體驗上的問題。這是一個巨大的拐點。
36氪汽車:如果沒有華為,你們全量推送的節(jié)奏會不會更往后一點?
任少卿:華為也是因為之前有人喊出了100城,所以才往前走一點。中國跟美國智駕市場不一樣,特斯拉更多按照自己的節(jié)奏來走,但中國是一堆人在旁邊,大家都在互相卷。
36氪汽車:智駕追求安全和穩(wěn)健,這跟這行業(yè)競爭的快節(jié)奏有沖突嗎?
任少卿:我們的長期目標大家可能都認同,但短時間內確實非常卷,每個月不發(fā)一個智駕版本可能都會覺得落后,所以每個月都在發(fā)版。客觀問題逃脫不了的。
但長期工作一定要堅持。工程師如果只為了每個月發(fā)版而卷,那沒有意義。比如這版開發(fā)了某個功能,但下一版就沒有了。長期的認知框架,可以保證做的事持續(xù)有用。
還要有很強的測試能力,測試迭代的能力能保證能夠實現(xiàn)終極目標。比如原來智駕半年做一次測試,但現(xiàn)在每月一測。如果測試搞不定,就隨便發(fā)出去嗎?這肯定不行。
全國道路都能開,實際有兩件事要做。第一是路真的能開,包括通用檢測能力,去復雜路口記一些東西。這都是技術算法范疇。
第二是能驗證。中國城區(qū)道路各種各樣,北京朝陽跟海淀,跟平谷就不是一個世界。怎么能驗證這些路都能開,其實是一個復雜系統(tǒng)。
「談蔚來智駕:我們習慣把基礎的東西做完」
36氪汽車:有技術公司認為,智駕是標準化的功能,不是產品,車企不應該做,您怎么看?
任少卿:我們不覺得智駕是功能,甚至也不是產品,我們覺得它是個服務。服務需要長期更新的,給用戶提供可用、安全的、領先的東西。所以這也是我們一直在推訂閱服務的原因,從商業(yè)邏輯上來說,買斷智駕是不現(xiàn)實的。
買斷一定會導致大家短視。就是現(xiàn)在很多車賣了,功能裝到車上就結束了,后面更新就看車企的良心。
從價值來看,車如果要讓用戶事故率下降30%,肯定不能只把它當功能來做。功能只是智駕的低級階段,但是中高階段一定很快會來。
36氪汽車:一些車企智駕做的不錯了,但市場還是懷疑,智駕是不是真得能幫助賣車?
任少卿:說白了智駕還是個小眾市場,還沒有進入大眾市場。
這是需要我們從業(yè)者去做的。第一,價值持續(xù)擴大,城區(qū)智駕就是一個價值擴大的點。之前高速NOA的體驗成本太高了,繞兩小時才能體驗到。城區(qū)智駕,可以降低用戶試駕的認知成本。第二,智駕的安全性需要很強的第三方證明。有了證明報告,消費者能看到實際的智駕價值。
36氪汽車:現(xiàn)在智能駕駛的技術構型成熟了嗎?還會有大的技術拐點嗎?
任少卿:從技術角度來看,基本框架都在了,后面需要持續(xù)迭代和運營,是個系統(tǒng)性工程。比如怎么證明蔚來的總體事故率 (包括人駕、人機共駕)真的減少30%,很難。因為用戶只有在出事故時,才有明顯體感。
但從規(guī)模群體來看,是有可能的。所以我們也在探索保險業(yè)務,跟第三方合作驗證