欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

世界模型：自動(dòng)駕駛的“仿真利器”還是終極答案？

02-06 06:21

世界模型的“理想圖景”與“現(xiàn)實(shí)落地”。

文｜肖漫

編輯｜李勤

過(guò)去兩三年，車企談及智能駕駛時(shí)，總會(huì)拋出各類新穎技術(shù)名詞。

世界模型是繼端到端、VLA之后，智駕領(lǐng)域最熱門的概念。不同企業(yè)還給它賦予了獨(dú)特名稱——小鵬推出“世界基座模型”、蔚來(lái)提出“端到端世界模型”、華為打造“世界行為模型”（WA）。此外，地平線、理想、元戎啟行、Momenta等企業(yè)也在布局世界模型相關(guān)技術(shù)。

但僅看企業(yè)發(fā)布會(huì)，很難分辨這些“世界模型”是否為同一技術(shù)；它究竟解決什么問(wèn)題，又在智能駕駛架構(gòu)中處于什么位置？

從廣義語(yǔ)境來(lái)看，“世界模型”本質(zhì)是在虛擬空間重建真實(shí)世界，讓人工智能能像人類一樣理解現(xiàn)實(shí)，認(rèn)知物理規(guī)律、事物因果關(guān)系及環(huán)境動(dòng)態(tài)變化的技術(shù)。

世界模型被多數(shù)科學(xué)家和科技公司視為“物理世界AI”發(fā)展的關(guān)鍵。斯坦福大學(xué)教授李飛飛曾表示，空間智能是AI的下一個(gè)十年，而世界模型是構(gòu)建空間智能的核心技術(shù)。

前沿科學(xué)家和企業(yè)仍在探索，但中國(guó)汽車行業(yè)已用各類新穎概念占據(jù)了賽道位置。

實(shí)際上，當(dāng)前智駕行業(yè)的“世界模型”只是名詞表述不同，技術(shù)路徑差異不大。它是對(duì)原有仿真工具的技術(shù)范式升級(jí)，通過(guò)還原度、顆粒度更高，場(chǎng)景更豐富、自由度更強(qiáng)的虛擬世界，解決端到端模型的測(cè)試與驗(yàn)證問(wèn)題，最終目標(biāo)是訓(xùn)練出更高效、更擬人化的端到端智駕模型。

簡(jiǎn)單來(lái)說(shuō)，智駕廠商和車企并非打造完整的數(shù)字物理世界，只是用世界模型的思路構(gòu)建仿真器。

盡管各家對(duì)世界模型的期待不同，但據(jù)了解，目前智駕行業(yè)的世界模型僅應(yīng)用于云端，尚未實(shí)現(xiàn)在汽車端的部署。

端到端普及，暴露傳統(tǒng)仿真器不足

過(guò)去兩三年，頭部智駕方案從規(guī)則棧轉(zhuǎn)向AI驅(qū)動(dòng)，在形式上實(shí)現(xiàn)統(tǒng)一：將感知、預(yù)測(cè)、規(guī)劃盡可能整合到一個(gè)網(wǎng)絡(luò)中，搭配更大模型和更高算力。正如車企發(fā)布會(huì)上常說(shuō)的，“端到端后的智駕更像人開車”。

但實(shí)際應(yīng)用中出現(xiàn)了反直覺現(xiàn)象：端到端后的新版本OTA不一定更優(yōu)，甚至可能“退步”。

問(wèn)題核心并非模型變差，而是AI驅(qū)動(dòng)讓評(píng)估與回歸更困難。

此前許多智駕從業(yè)者認(rèn)為，只要前端訓(xùn)練足夠好，車輛就能像人一樣駕駛。這條路徑初期效果顯著，讓從業(yè)者震撼，但端到端的“黑盒”特性也帶來(lái)副作用：模型出錯(cuò)時(shí)，研發(fā)人員難以知曉原因，也無(wú)法證明下次不會(huì)再犯。

模型優(yōu)劣不再僅取決于“訓(xùn)練規(guī)模和數(shù)據(jù)量”，更在于能否發(fā)現(xiàn)、定義和驗(yàn)證問(wèn)題。廠商逐漸意識(shí)到，需要更優(yōu)的仿真器在模型驗(yàn)證階段評(píng)估其表現(xiàn)。

頭部企業(yè)大多將世界模型作為仿真器應(yīng)用。為讓理想VLA在仿真環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí)，理想在2025年提出包含自車和他車軌跡的駕駛世界模型，充當(dāng)“打分老師”；小鵬雖對(duì)外提及“世界基座模型”這一與世界模型本質(zhì)無(wú)關(guān)的名詞，但據(jù)36氪汽車了解，其也在利用世界模型進(jìn)行仿真測(cè)試，評(píng)測(cè)新版本模型算法能力。

端到端的普及凸顯了傳統(tǒng)仿真器的短板。“以前端到端未普及，驗(yàn)證成本不高，還能分段驗(yàn)證系統(tǒng)。但端到端后無(wú)法分段驗(yàn)證，仿真器的問(wèn)題就暴露了。”一位業(yè)內(nèi)研發(fā)人員表示。

在規(guī)則時(shí)代，車企做仿真主要服務(wù)兩件事：一是重現(xiàn)半路接管的問(wèn)題，回放路測(cè)中出現(xiàn)問(wèn)題的片段；二是通過(guò)仿真器增加corner case的數(shù)據(jù)豐富度，在模擬器中搭建典型路口、橫穿行人、加塞車輛等腳本場(chǎng)景，讓系統(tǒng)運(yùn)行測(cè)試。

當(dāng)時(shí)的仿真器更像“放大鏡”，但端到端后，模型責(zé)任難以拆分，也難以系統(tǒng)性生成更細(xì)致、可控的corner case，更無(wú)法支撐端到端所需的大規(guī)模閉環(huán)驗(yàn)證——這正是引入世界模型的原因。

端到端時(shí)代，世界模型是智駕模型的“教練”

“目前國(guó)內(nèi)車企世界模型的水平與特斯拉存在一定差距，但相差不到一年時(shí)間。”一位業(yè)內(nèi)人士稱。

特斯拉未使用“世界模型”概念，而是提出“世界模擬器”（去年ICCV上由特斯拉自動(dòng)駕駛副總裁Ashok Elluswamy首次提及）。該模擬器基于特斯拉自建的海量數(shù)據(jù)集訓(xùn)練，能根據(jù)當(dāng)前狀態(tài)和下一步動(dòng)作生成未來(lái)狀態(tài)，與車端端到端基礎(chǔ)模型形成閉環(huán)，進(jìn)行真實(shí)效果評(píng)估。

一位業(yè)內(nèi)人士指出，特斯拉更傾向用神經(jīng)網(wǎng)絡(luò)“擬合”世界，渲染過(guò)程通過(guò)計(jì)算生成，盡量減少顯式物理規(guī)則堆疊；素材庫(kù)并非完全由人預(yù)定義，而是保留了概率權(quán)重與組合空間，這樣能增強(qiáng)模型的泛化能力。

國(guó)內(nèi)車企多選擇更“可控”的路線。與36氪汽車交流的一家供應(yīng)商表示，理想采用3D高斯重建——這也是目前多數(shù)車企采用的方式之一。

無(wú)論哪種路線，世界模型在工程上最終指向同一方向：車企將其作為端到端時(shí)代的“驗(yàn)證與反證系統(tǒng)”，在云端重放、改寫、擴(kuò)增現(xiàn)實(shí)駕駛中可能出現(xiàn)的情境，檢驗(yàn)車端大模型輸出是否穩(wěn)定、可復(fù)現(xiàn)，并讓“哪里錯(cuò)、為什么錯(cuò)”重新成為可追蹤的證據(jù)鏈。

世界模型的角色類似教練員，優(yōu)秀的教練能培養(yǎng)出優(yōu)秀的運(yùn)動(dòng)員?！半S著云端世界模型不斷增強(qiáng)，理論上車端模型的能力也會(huì)越來(lái)越強(qiáng)?！币晃谎邪l(fā)人員說(shuō)。

世界模型的核心能力主要有兩方面：一是對(duì)物理世界的數(shù)字化建模與抽象；二是基于建模，對(duì)物理世界進(jìn)行合理想象和預(yù)測(cè)，比如通過(guò)給定圖片預(yù)測(cè)未來(lái)世界的變化。

世界模型的好壞取決于能否在云端生成足夠真實(shí)、多樣的數(shù)據(jù)?！叭绻嚻笾皇怯貌杉恼鎸?shí)數(shù)據(jù)做仿真，那不是在做世界模型，只是一套回放數(shù)據(jù)的流程?！币晃还?yīng)商產(chǎn)品經(jīng)理表示。

世界模型需要從物理世界數(shù)據(jù)中學(xué)習(xí)運(yùn)行模式，因此訓(xùn)練數(shù)據(jù)質(zhì)量會(huì)顯著影響生成質(zhì)量。極佳視界產(chǎn)品線負(fù)責(zé)人毛繼明提到：“對(duì)于世界模型這類生成模型，生成結(jié)果最終會(huì)對(duì)齊輸入數(shù)據(jù)的特征分布規(guī)律。在真實(shí)商業(yè)化過(guò)程中發(fā)現(xiàn)，如果數(shù)據(jù)質(zhì)量只有60分，基于此的世界模型生成數(shù)據(jù)質(zhì)量可能只有55分?！?/p>

借助世界模型，車企在云端做仿真時(shí)，可從各維度無(wú)限生成所需場(chǎng)景，還能根據(jù)指令生成視頻作為訓(xùn)練數(shù)據(jù)?！靶时日鎸?shí)采集后再訓(xùn)練高很多，模型迭代速度會(huì)實(shí)現(xiàn)斷代式領(lǐng)先?！币晃还?yīng)商研發(fā)人員稱。

但這些都是理想化結(jié)果。“世界模型相比智駕用的仿真器，或不用仿真信息僅用離線數(shù)據(jù)驗(yàn)證，已是很大升級(jí)，但距離理想仿真器還有差距?！?/p>

世界模型算法尚未成熟，仍存“幻覺”問(wèn)題

行業(yè)目前普遍處于起步階段。

一位車企研發(fā)人員告訴36氪汽車，國(guó)內(nèi)廠商基于世界模型最長(zhǎng)能生成30-60秒的視頻片段，但動(dòng)態(tài)物體的一致性不佳，時(shí)空一致性和多視角一致性都存在較大問(wèn)題。

世界模型底層是生成式模型，天生存在“幻覺”風(fēng)險(xiǎn)?！澳壳笆澜缒Ｐ妥铍y的是保證生成內(nèi)容的真實(shí)性，比如生成的人，其行為、軌跡要符合真實(shí)世界邏輯。”一位供應(yīng)商產(chǎn)品經(jīng)理表示，“如果世界模型生成錯(cuò)亂，會(huì)導(dǎo)致模型學(xué)到錯(cuò)誤信息，進(jìn)而讓車端模型效果變差?！?/p>

一個(gè)極端例子：如果云端生成的車都是橫著走的，模型會(huì)認(rèn)為左前方的車會(huì)瞬間移動(dòng)到右前方，實(shí)際駕駛中可能做出剎車動(dòng)作。

若仿真器無(wú)法逼近現(xiàn)實(shí)世界的關(guān)鍵因果關(guān)系，比如濕滑路面對(duì)制動(dòng)距離的影響、逆光下靜止物體的誤檢概率、并線時(shí)對(duì)方車輛的博弈策略等，生成的“corner case”可能是虛假的；在假問(wèn)題上優(yōu)化，等于浪費(fèi)研發(fā)資源在幻影上。

很多人認(rèn)為世界模型的瓶頸在數(shù)據(jù)與算力，但前理想汽車輔助駕駛“端到端”模型負(fù)責(zé)人夏中譜更認(rèn)同Lecun的觀點(diǎn)：“世界模型算法層面沒有大突破，圖像模型的自監(jiān)督訓(xùn)練還未找到像語(yǔ)言模型那樣順暢的范式。”

語(yǔ)言模型能快速規(guī)?；?，原因之一是語(yǔ)言信息密度高，每個(gè)詞都有明確語(yǔ)義約束。而圖像信息密度低，對(duì)“駕駛決策”而言，有用信息占比極小。

例如，模型無(wú)需預(yù)測(cè)正后方遠(yuǎn)處車輛的軌跡，也無(wú)需預(yù)測(cè)遠(yuǎn)處建筑物的變化，這些都是噪聲數(shù)據(jù)；但必須預(yù)測(cè)本車道前車是否會(huì)急剎、旁車是否會(huì)搶道、行人是否會(huì)橫穿，模型要先知道“該關(guān)注什么”。

“目前智駕算法無(wú)法提取足夠?qū)︸{駛有用的圖像信息。”夏中譜說(shuō)。一張圖像可能有上百萬(wàn)像素點(diǎn)，但與決策相關(guān)的僅20多個(gè)，其他都是噪聲，模型需先學(xué)會(huì)從噪聲中抓取1‰甚至1?的有效信號(hào)，再將信號(hào)組織成可用于推理和預(yù)測(cè)的結(jié)構(gòu)。

在夏中譜看來(lái)，世界模型算法尚未突破，更談不上數(shù)據(jù)是否足夠、算力是否充足的問(wèn)題。正因基礎(chǔ)技術(shù)無(wú)明確突破，車企投入多為研究性質(zhì)，部分車企老板對(duì)此也很迷茫。

若世界模型足夠好且算力支撐，是可以部署到車端的?！皣?guó)內(nèi)現(xiàn)在基本把世界模型當(dāng)仿真系統(tǒng)用，對(duì)智駕決策層面的技術(shù)理解還不夠。”夏中譜表示。

這也解釋了一個(gè)表面矛盾：為何各家都在講世界模型，但用戶體感差異不明顯——因?yàn)槎鄶?shù)企業(yè)的世界模型仍停留在“訓(xùn)練與驗(yàn)證”的第一階段，尚未進(jìn)入“支撐決策規(guī)劃”的第二階段。

“在車端部署世界模型是最難的?！毕闹凶V說(shuō)。

目前尚無(wú)企業(yè)在車端應(yīng)用世界模型。他同時(shí)指出：“用大模型方法建模物理世界，通過(guò)與物理世界交互預(yù)測(cè)發(fā)展變化，進(jìn)而通過(guò)決策讓世界朝有利方向發(fā)展。若世界模型能做到這一步，自動(dòng)駕駛和機(jī)器人相關(guān)問(wèn)題都能解決。”

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

為何聚焦高數(shù)值孔徑EUV光刻技術(shù)？

極兔中國(guó)戰(zhàn)略轉(zhuǎn)向背后：為何口碑成為最先崩塌的一環(huán)？

英皇娛樂酒店出售大堂黃金獲利近10倍收益超9000萬(wàn)港元

深圳明星企業(yè)北芯生命科創(chuàng)板IPO：紅杉中國(guó)為第一大機(jī)構(gòu)股東，改寫冠脈診斷進(jìn)口依賴格局

中國(guó)本土創(chuàng)新醫(yī)療器械領(lǐng)軍企業(yè)北芯生命科創(chuàng)板成功上市

項(xiàng)目推薦

康小虎 · 健康小屋

康老板 · 氧療堂

<rt id="w8oku"></rt>