奧推網

選單
歷史

自動駕駛3.0的關鍵詞:大模型、量產和漸進式路線

2022年自動駕駛繼續換擋提速。

特斯拉 2022 年 Q2 財報顯示,FSD Beta 版10萬名測試使用者累計行駛約 4200 萬英里,馬斯克預計如若今年底測試人數擴大到 100 萬,FSD Beta 累計行駛里程將很快突破 1 億英里。FSD全稱為Full Self-Drive即“完全自動駕駛”,馬斯克曾明確表示FSD是特斯拉的未來,也是特斯拉最重要的資產。不過特斯拉FSD被很多人認為是馬斯克在“畫餅”,因為L5級完全自動駕駛不可能在短期內落地。

在中國市場,自動駕駛“漸進式落地”呈現出更強的活力。工信部資料顯示,今年上半年 L2 級輔助駕駛乘用車新車市場滲透率達到 30%,同比增加 12。7%。在很多人印象中只有蔚小理等“新勢力”具備智慧駕駛能力,實際上傳統車企也不遑多讓,比如長城汽車8月銷售新車 88226 輛,其中智慧化車型佔比已提升至 85。59%。

除高級別智慧駕駛量產加速外,中國自動駕駛在法律法規、測試道路、商業場景等維度均取得突破,截至目前已有30多個城市出臺智慧網聯汽車道路測試管理辦法和實施細則,來自2022世界智慧網聯汽車大會的訊息顯示,全國開放各級測試公路超過7000公里,實際道路測試里程超過1500萬公里,自動駕駛出租車、無人巴士、自主代客泊車、幹線物流以及無人配送等多場景示範應用有序開展。

自動駕駛技術歷史悠久,不過一直到2010年前後才進入大眾視野,彼時谷歌、百度等科技巨頭入局這一賽道,掀起了延續至今的技術浪潮。而從技術演進路線來看,在全球範圍內自動駕駛技術都呈現出一個新的趨勢:不再是硬體或者軟體驅動,不再是測試道路下的資料驅動,而是以真實道路行駛場景為核心的資料驅動,這是自動駕駛3。0的標誌。

自動駕駛3.0時代來臨

今天看一家自動駕駛企業的技術實力,首先要看運營里程,如同晶片要看晶圓、儲存要看容量一樣,原因在於:自動駕駛本質上是AI技術,而AI運轉的核心邏輯是:將高質量資料不斷填餵給AI,AI透過自學習不斷進化,一家企業運營里程越多獲得的資料越多,既意味著智慧化程度越高,也表明其具有“久經真實場景考驗”的實力。

當前,全球範圍內有機會衝擊1億公里級運營里程俱樂部的有兩家企業:一個是特斯拉,基於百萬級車主的參與,其FSD累積行駛里程將衝向1億英里;另一個是毫末智行。在第六屆 HAOMO AI DAY 上,毫末智行董事長張凱透露,毫末智行使用者輔助駕駛行駛里程已突破 1700 萬公里,位列中國自動駕駛公司第一名,其預計到 2025 年,高級別輔助駕駛搭載率將超 70%。

毫末智行CEO 顧維灝在AI DAY 上提出,行業正在進入以資料驅動為核心的新時代:自動駕駛3。0時代。那麼,到底什麼是自動駕駛3。0?

硬體驅動的1。0時代:從谷歌等科技巨頭的初代無人車開始的自動駕駛1。0時代,硬體是核心驅動,基於傳統車型改裝的無人車上都遍佈著鐳射雷達等硬體,車尾箱藏著負責AI計算的主機等裝置,這一階段硬體就是自動駕駛的能力上限,特別是雷達感測器,其數量越多、效能越強,對應的自動駕駛智慧化程度就越高。

硬體驅動的自動駕駛問題顯著,一個是整車成本居高不下,改造成本動輒上百萬;另一個是智慧化程度較低,因為硬體迭代需要很長的週期,這一階段的無人車只能小範圍探索,未能走向大規模商用或量產,行駛里程在100萬公里內。

軟體驅動的2。0時代:2016年AlphaGo戰勝李世石後,以深度學習為基礎的AI技術大行其道,經歷多年硬體驅動的自動駕駛邁入軟體驅動時代。大算力中央計算晶片上車,在鐳射雷達感測器外,基於多路攝像頭實現機器視覺等新的感知模式日益流行,隨著邊緣計算發展雲也以多種形式參與其中,這些都大幅降低了單車成本,提升了智慧效果,自動駕駛里程逐漸增加至上千萬公里。

資料驅動的3。0時代:可被視作是2。0時代的延續,AI依然是核心技術,核心不同在於:AI對資料的要求發生了質變,“大模型”成為新的技術基石。

2021年,國外的微軟、英偉達、谷歌,國內的浪潮、華為和阿里……越來越多科技巨頭都在佈局AI大模型。深度學習高速發展十年來,AI進入工業化階段,其支撐更加廣泛普適的場景,要支撐更大更復雜的AI計算需求,要實現從弱人工智慧到強人工智慧的升級,傳統訓練模式已很難滿足,具有“巨量資料、巨量算力、巨量演算法”特性的AI大模型生逢其時,其本質是深度學習的“加強版”,透過給模型“填喂”大資料提高其自學習能力,進而具有更強的智慧程度。微軟CEO納德拉說:“深度學習在過去20年或10年取得了巨大進展,大模型將是下一個大事件”,此言非虛。

AI大模型支援“AI預訓練”,支援透過堆疊資料集“貪婪式訓練”,十分適合在自動駕駛上應用,包括感知、認知和決策。以大模型AI為核心技術,由真實道路資料驅動的自動駕駛3。0將有如下不同:

1、規模:圍繞真實道路場景,資料規模更大、多樣性更充分,行駛里程將邁進 1 億公里級。

2、感知:以大模型AI為基礎,雷達、視覺等感測器聯合工作,多模態共同輸出結果。

3、認知:在各類場景下模擬人的認知行為,結合人類的駕駛常識決策,提高行車舒適性。

4、模式:不再是人工強監督、強規劃、強介入的深度學習模式,而是基於大資料大模型的AI,海量大資料自訓練,基於資料通道和計算中心實現更高效的積累資料,將資料轉化為知識。

簡而言之,自動駕駛3。0時代依然是以AI技術為基礎,但內涵卻已發生變化:一個是大模型已取代傳統深度學習成為新的訓練模式,另一個是自動駕駛行駛里程邁上新臺階,資料越來越“大”,這給大模型驅動的自訓練自動駕駛創造了條件,極大地加速了自動駕駛的落地程序,而當自動駕駛行駛里程從百萬到千萬再到一億規模以上時,量變也將引發質變。

3.0將是少數派的遊戲

相較於1。0時代與2。0時代而言,3。0時代的自動駕駛的核心邏輯已發生變化,舞臺中央的玩家將會大幅減少,原因如下:

第一,自動駕駛3。0是資料驅動,更是“真實場景下的海量大資料驅動”。

正如前文所言,自動駕駛3。0的基礎是AI大模型,這需要足夠“大”的資料,包括里程規模、多樣性等。一個重要的細節是:毫末智行、特斯拉公佈的是“運營里程/行駛里程”,還有一些企業公佈的是“測試里程”,此“里程”非彼“里程”,就算有些企業的測試里程資料高於毫末、特斯拉的運營里程/行駛里程,但價值卻相去甚遠。

前些年自動駕駛企業普遍公佈測試里程資料,因為其車輛只能在部分開放測試道路上跑,這樣的資料越到後面價值越小,因為自動駕駛技術有著“長尾效應”,正如交通運輸部公路科學研究院中心主任周煒所言:“自動駕駛也有長尾效應,比如說自動駕駛智慧車輛測試,測試50天內能夠發現99。9%的問題,那0。1%的問題可能5000天未必能發現和解決。再從測試里程來說,在15萬公里測試時就能發現99。9%的問題,那0。1%的問題未必在15億公里中能發現和解決。”

要突破自動駕駛的長尾效應,就要不斷擴大道路行駛場景,最理想的狀況就是開放式道路,汽車能到的地方自動駕駛都能到。“漸進式落地路線”讓這一點變為現實,在這一路線下自動駕駛技術的形式是高級別輔助駕駛,可在開放式道路執行,當然,這又有一個前置條件:足夠的車參與進來。

特斯拉FSD可邁向1億英里行駛里程的前提是百萬級車主參與測試,其努力了幾十年才做到百萬+量產車下線,中國造車新勢力距離百萬量產都相去甚遠。

毫末智行的底氣在於其是“中國量產輔助駕駛規模化第一名”,其採取獨特的鐵三角發展模式:“場景化使用者體驗設計、AI 人工智慧技術、技術工程化能力三者的高度有效協同”,其用 2 年時間研發三代智慧駕駛系統HPilot,依託長城實現 10 餘款不同平臺車輛量產落地、全新車型複用開發,如魏牌摩卡、坦克 500等主流車型。HPilot3。0將在 2022 年內正式落地,將成為中國第一家真正量產城市 NOH 的高級別輔助駕駛產品。

簡言之,毫末智行依託量產落地能力掌握著使用者場景入口,擁有海量真實道路場景下的高質量、多樣化大資料,進而掌握了自動駕駛3。0時代的入場券。可斷言,自動駕駛技術的終極贏家一定是擁有真實道路場景的玩家,這也是為什麼一些頭部自動駕駛技術玩家要耗巨資下場造車。

第二,自動駕駛3。0跑真實場景,必須走“從輔助駕駛到自動駕駛的漸進式路線”。

自動駕駛路線有兩類:

一個是頂層設計面向完全自動駕駛形態,“一步到位”的躍進式路線,輕的是需要製作高精地圖讓自動駕駛“看得清”,重的則需要改造道路基礎設施,對紅綠燈乃至公路進行重建,以及在路側裝配相關的車路協同裝置,這一路線的好處是可直接進入到高級別自動駕駛階段,但建設成本高,建設週期長、維護成本不小,當下只在極少部分測試道路如某高速的一段落地。

另一個則是面向現有路網的輔助駕駛技術,跟傳統汽車共用一個交通體系的漸進式路線。這一路線不需要改造道路等基礎設施甚至不需要高精地圖,成本更低,門檻更低,難度更小,更利於大規模落地,但短板在於初期自動駕駛級別不高,先從L2起步。

“讓一部分車完全智慧起來”還是“讓車先智慧一點點”?特斯拉與毫末智行的選擇是第二點,這將更有利於其參與自動駕駛3。0的角逐,因為3。0的“資料驅動”需要的是“真實場景下的海量大資料”,要獲得對應資料,既要有量產能力下的使用者入口,還要有對應道路的真實行駛能力,而漸進式路線正是資料積累的最佳路徑。相反,採取“躍進式路線”的玩家受限於開放測試道路里程、道路智慧化改造程序等,在行駛里程上將會被極大地拉開差距。

張凱此前曾明確表示,毫末的世界觀在於從一開始就認定了要走漸進式發展路線。在AI DAY上其進一步明確輔助駕駛是通向自動駕駛的必由之路,因為“漸進式路線的量產時間更早,能夠快速形成規模化,從使用者真實使用場景中積累足夠多的資料。”相較於躍進式路線定向採集資料方式而言,漸進式採集資料的成本更低、質量更高。在毫末智行的實踐中,自動駕駛產品能力、規模資料獲取的成本和質量三者已形成正迴圈效應。

或許“讓一部分車完全智慧起來”的理想派玩家可推出更完美的自動駕駛解決方案,但機率很小且短期內看不到希望。而“讓車先智慧一點點”的玩家至少當前已經實現量產商用,且在資料的不斷積累中悄然進化,技術的成熟與商業的回報兩不誤,這也更符合商業本身的規律。

第三,自動駕駛3。0是強人工智慧,需要全新的演算法與算力基礎設施。

自動駕駛3。0依託AI大模型,而大模型具有“巨量資料、巨量演算法、 巨量算力”三大特徵,每一特徵都意味著AI大模型是門檻很高的技術競賽,對於任何企業包括巨頭來說,打造一個大模型都不是一件容易的事情,需要收集海量資料、需要採買海量算力、需要進行大量研發,金錢、時間、人力投入同樣“巨量”,正是因為此構建AI大模型的企業幾乎都是財力雄厚、技術強悍的巨頭——微軟甚至宣稱其用了價值10億美元的超級計算機來訓練其AI大模型。

在巨量資料層面,具備商用量產能力、使用者場景入口、真實道路場景的玩傢俱有顯著優勢,這一點毫末智行、特斯拉們優勢明顯。

在巨量演算法層面,毫末智行早已在準備。其早在去年 12 月的 AI DAY 上就釋出中國首個數據智慧體系 MANA,可對海量資料進行深度挖掘。在將AI大模型應用到自動駕駛上,毫末智行也已探索多時,據顧維灝介紹,毫末早在 2021 年 6 月就啟動了針對 transformer 大模型的研究和落地嘗試,基於過去一年多對訓練平臺的改造升級,資料規格和標註方法的切換準備, 針對感知、認知具體任務的模型細節探索,這給毫末在城市導航輔助駕 駛場景中打下了堅實基礎。

在AI DAY上,毫末智行基於“重感知、輕地圖”技術實踐,推出第一個重感知的城市輔助駕駛方案,透過AI大模型克服「城市道路養護頻繁」、「大型車輛密集」、「變道空間狹窄」、「城市環境多樣」等城市智慧駕駛難題。

在巨量算力層面,科技巨頭無疑具有先天優勢,但特斯拉、毫末們也在加速佈局。特斯拉在去年釋出了超級計算機 Dojo,毫末智行的解決方案是超算中心,其發現隨著 Attention 大模型的應用,自動駕駛對算力的需求已遠遠超出摩爾定律,這導致大模型訓練成本非常高,在終端裝置上落地尤其困難。針對此毫末佈局低碳超算,在去年 12 月就已宣佈在籌建自己的超算中心,此外其還透過改進車端模型、晶片設計和資料組織等方式讓AI大模型在自動駕駛場景更低成本的落地。

同時具備“真實場景下的海量大資料驅動”、“走從輔助駕駛到自動駕駛的漸進式路線”,“足夠強大的演算法與算力基礎設施”的玩家是鳳毛麟角,自動駕駛3。0註定是少數派的遊戲,當下,特斯拉與毫末智行是更具備相關特徵的玩家。

不過,即便步入1億公里行駛里程階段,自動駕駛要全面落地依然任重道遠。自動駕駛3。0實現就面臨著不少技術挑戰,正如顧維灝在AI DAY上所總結的那樣:

如何在自動駕駛領域應用大模型;

如何讓資料發揮更大的價值;

如何使用重感知技術解決現實空間理解問題;

如何使用人類世界的互動介面;

如何讓模擬更真;

如何讓自動駕駛系統運動起來更像人。

攻克這些難題,也將是毫末等自動駕駛3。0主流玩家接下來的重任。

寫在最後:

自動駕駛是未來已成為科技、汽車、交通等產業的共識,但到底怎樣實現?自動駕駛將以何種姿態走向大眾?行業一直沒有統一答案,這些年來,各路玩家摸著石頭過河,探索不同路線,共同推動著自動駕駛技術的進化。

那麼,到底什麼才是自動駕駛的終局?現在看來,不論是特斯拉首次提出的“資料閉環”,還是毫末智行率先喊出的“資料驅動的3。0時代”,都在讓爭議逐漸變為共識,自動駕駛的未來圖景也更加清晰:在真實道路場景的海量大資料驅動下,以大模型等AI新技術為基石,讓演算法自訓練不斷進化,進而讓車像司機一樣思考,讓完全自動駕駛不再遙遙無期。基於此,到底要走漸進式路線還是躍進式路線,到底要採取“強感知、輕地圖”還是“感知融合 + 高精地圖”的技術方案,行業也將很快形成更大的共識。