出品: 電動(dòng)星球
作者:毓肥
從上周開始,有關(guān)蔚來世界模型 NWM 的傳言、感受、推測(cè),就開始在輿論場(chǎng)醞釀。
比如蔚來智能駕駛產(chǎn)品與體驗(yàn)負(fù)責(zé)人 @Harry_AD,5 月 16 號(hào)發(fā)布的首個(gè)封版體驗(yàn)視頻:
目前剩下的懸念,就是「到底能不能打?」
尤其是 ADS 4 搶下了「率先發(fā)布商用 L3」的輿論陣地,另一邊理想 VLA 路線也已經(jīng)處于發(fā)布階段,蔚來今年能否上演一次「絕地翻盤」?
我們簽了保密協(xié)議,但今天還是可以根據(jù)已有信息簡(jiǎn)單聊幾句。
1. 什么是蔚來世界模型?
世界模型不是蔚來首創(chuàng)的概念,它是人工智能領(lǐng)域一個(gè)具有幾十年歷史的老詞。
事實(shí)上汽車圈以外,最近最具熱度的世界模型,是谷歌發(fā)布的 Genie 2,它可以生成多種多樣的 3D 世界,任何人都可以在模型內(nèi)用自己的語言定義一個(gè)世界,Genie 2 甚至可以模擬世界內(nèi)人物的動(dòng)作。
同理,蔚來 NWM 可以為智駕系統(tǒng)模擬出同一個(gè)場(chǎng)景下的不同路況,比如生成左轉(zhuǎn)、右轉(zhuǎn)、直行的不同路況,并生成仿真視頻。
李斌此前提到,NWM 可以蒸餾到樂道的地平線芯片方案上,同時(shí) NT2 的四 Orin、NT3 的神璣,也都會(huì)陸續(xù)推送世界模型方案。
@Harry_AD 的官方表態(tài)則是:
「現(xiàn)款的樂道車型預(yù)計(jì)在今年合適的時(shí)間,會(huì)基于端到端模型進(jìn)行體驗(yàn)迭代,L60 始終會(huì)保持相當(dāng)?shù)母?jìng)爭(zhēng)力。 后續(xù)樂道品牌也會(huì)有基于蔚來世界模型架構(gòu)的輔助駕駛量產(chǎn)解決方案?!?/p>
這意味著蔚來公司的不同車端硬件方案,將來可以共享同樣的技術(shù)底座。
2. 蔚來世界模型是不是端到端?
理論上,任何生成式 AI 都是端到端——「輸入端」到「輸出端」。
從特斯拉 2019 年推出高速 NOA 以來,過去六年間所有車企、供應(yīng)商努力的,都是如何讓輔助駕駛端到端的過程更真實(shí)、更統(tǒng)一。
而這六年間我們聽到過無數(shù)營銷名詞:「全國都能開」、「全國都好開」、「一段式端到端」、「兩段式端到端」,本質(zhì)上都是技術(shù)前進(jìn)路線的一個(gè)個(gè)節(jié)點(diǎn)。
世界模型、基座模型,與端到端、VLA 很難放在同一個(gè)維度下討論。
比如 Waymo 去年 11 月發(fā)布的 EMMA,全稱就是「自動(dòng)駕駛端到端多模態(tài)模型 End-to-End Multimodal Model for Autonomous Driving」,它的技術(shù)原理和 VLA 一致;而 Waymo 表示 EMMA 是基于基座模型 Gemini「開發(fā)」的自動(dòng)駕駛專用模型。
3. 蔚來世界模型能不能打?
從技術(shù)原理上看,世界模型擁有更符合「第一性原理」的技術(shù)基礎(chǔ)。它為輔助駕駛,以及之后的自動(dòng)駕駛搭建了統(tǒng)一的訓(xùn)練框架,而這個(gè)框架符合人類的直覺。
什么直覺?舉一反三。
早在 1971 年「Mental Model」概念提出的時(shí)候,從認(rèn)知科學(xué)到人工智能學(xué)界,都力求打造一個(gè)對(duì)真實(shí)世界完成「認(rèn)知、推理、決策」全流程的「大腦」。
過程中衍生出一個(gè)概念:「反事實(shí)推理」,它讓深度學(xué)習(xí)模型擁有回答「what if 如果 ...」問題,也就是「憑空想象可能性」的能力。
舉一反三人類與生俱來,但 AI 不行,或者說需要外力。世界模型則成為谷歌、OpenAI 等企業(yè)「超越數(shù)據(jù)」,讓 AI 更接近人類直覺的工具。
當(dāng)然世界模型不一定是最終路線,但遵循人類直覺開發(fā)的輔助駕駛功能,已經(jīng)證明了它的價(jià)值。
大家都記得馬斯克的名人名言:「你不是靠雙眼發(fā)射激光在開車」;這句話說完六年后,特斯拉用 FSD V13 向國內(nèi)新造車證明了第一性原理的含金量。
自動(dòng)駕駛是否需要激光,還在商榷階段;但 FSD V13 的能力和體驗(yàn),感受過的國內(nèi)各家智駕研發(fā)同仁,只能說「一試一個(gè)不吱聲」。
比如 2020 年 10 月底,F(xiàn)SD Beta 正式推送的時(shí)候,就曾出現(xiàn)體驗(yàn)明顯的倒退;而當(dāng)馬斯克從 FSD V12 迭代到統(tǒng)一高速城區(qū)技術(shù)棧的 V13 過程中,也曾出現(xiàn)實(shí)際表現(xiàn)的螺旋上升。
4. 你能不能違反保密協(xié)議?
這個(gè)肯定不行,事實(shí)上 @Harry_AD 的官方視頻,已經(jīng)可以說明很多問題。
如果就那個(gè)視頻解讀,蔚來正在重新獲得輔助駕駛的話語權(quán)。而另一方面,強(qiáng)調(diào)安全、事故率,也是蔚來一貫的宣傳方式。
這里可以舉一個(gè)類比的例子:比起中國新造車層出不窮的數(shù)字競(jìng)賽,馬斯克基本只會(huì)用一種數(shù)字宣傳特斯拉 Autopilot(FSD)的能力:比如由 NHTSA 美國交通安全局公布的「汽車品牌事故率」。
當(dāng)然我們也不能讓看到這的大家撲個(gè)空,最后一句話總結(jié):
NWM 世界模型會(huì)定義自動(dòng)駕駛時(shí)代的蔚來,而從第一個(gè)版本開始,它就跟以往的 NOP 有了性格、性質(zhì)的差異。
(完)