目前,智駕大模型沒有一個公允定義,并且產學研不同領域的專家對智駕大模型的定義也不一樣,但結合各專家的觀點來看,智駕大模型具備多模態(tài)輸入、自監(jiān)督學習、端到端學習范式以及大規(guī)模參數的特征。但是,相比于通用類大模型,智駕大模型的主要差異在于:部署難度高、數據維度廣以及模型設計復雜。
• 億歐智庫認為,智駕大模型指的是在云邊端一體化的架構下,利用云端算力優(yōu)勢訓練大規(guī)模多模態(tài)數據,然后再結合邊端的計算能力,通過多任務的學習和分布式訓 練為車輛提供更有效的感知融合效果與實時建圖方案,最終讓車端實現(xiàn)與人類司機行為和思維一致的感知、預測、規(guī)劃等能力。
• 智駕大模型最重要的應用是數據閉環(huán),相比于傳統(tǒng)數據閉環(huán)而言,當前的數據閉環(huán)對自動駕駛系統(tǒng)賦能最多的主要是數據挖掘、自動標注、模型訓練、仿真測試四個 應用方向。從感知側的數據采集開始,會先根據篩選器的設置來進行數據挖掘,隨后通過自動化標注來對數據打標簽,再對原模型反復訓練并經過仿真測試后,最后 對車端小模型進行優(yōu)化,在經過反復地不斷迭代循環(huán)后,使得整個數據閉環(huán)能力能夠不斷提升。
• 對于已布局或正將布局的企業(yè),智駕大模型玩家主要可分為四類,其中新勢力主機廠以自研為主,而傳統(tǒng)主機廠持有保守觀望的態(tài)度;科技企業(yè)憑借強大的AI技術背 景和資本實力,構建了以云服務為基礎的垂直服務體系;Tier1以自研基于BEV感知的垂域大模型為主;芯片企業(yè)主要是優(yōu)化芯片的開發(fā)生態(tài),以便客戶能在自家芯片 上更容易地部署B(yǎng)EV+Transformer等大規(guī)模參數的模型。
2021年,特斯拉提出了BEV+Transformer的大模型,該模型也成為了之后國內玩家布局大模型的基礎。至2023年,智駕相關大模型開始大量出現(xiàn), 如華為盤古大模型、百度文心大模型、毫末DriveGPT等。
從多傳感器的融合趨勢來看,目標級融合(后融合)是當前行業(yè)內主流的融合方案,雖然算法開發(fā)難度較低,但融合精度較低、關鍵信息易缺失, 不適合未來融合趨勢的發(fā)展。數據級融合(前融合)是行業(yè)發(fā)展的目標,但技術壁壘高,短期內方案落地較難。所以,在不丟失關鍵信息的基礎上, 特征級融合(中融合)成為了一種合適的中間過渡形態(tài),也更適合在當前流行的Bev+Transformer模型架構下,實現(xiàn)大規(guī)模多模態(tài)數據的融合。
基于規(guī)則算法的目標級融合方案,只能識別出目標物的部分特征,甚至會出現(xiàn)無法識別目標物的情況,導致在最終融合結果上出現(xiàn)誤報、漏報等情 況。相反,基于BEV+Transformer的特征級融合方案,可以通過注意力機制提取目標物特征,并在鳥瞰圖下“腦補”出完整的目標物信息,有利 于提高整體感知融合精度。
![]() |
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務機器人底盤 核酸采樣機器人 機器人代工廠 智能配送機器人 噴霧消毒機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 消殺機器人 導覽機器人 |