周信/文 2025年2月22日,在“2025全球開發(fā)者先鋒大會(GDC)”的商湯大模型生產(chǎn)力論壇上,商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛發(fā)布了行業(yè)首個“與世界模型協(xié)同交互的端到端智能駕駛路線R-UniAD”。
在推動人工智能技術進步的過程中,算法、算力和數(shù)據(jù)是三大要素。在自動駕駛領域,自2024年3月起,特斯拉的“端到端”解決方案成為整車企業(yè)認可的主流智能駕駛方案。擁有強大學習和泛化能力、多模態(tài)融合能力、創(chuàng)新應用和功能拓展的大模型,在端到端系統(tǒng)比拼中起著至關重要的角色。
但此前的端到端智能駕駛方案仍存在諸多問題。首先,端到端的智能駕駛本質(zhì)上是通過海量的人類駕駛數(shù)據(jù)來實現(xiàn)最佳的“模仿”駕駛效果。相比特斯拉擁有700萬輛智駕車型的保有量,國內(nèi)各車企向市場推出的高階智駕車型較少,且每個車主的駕駛習慣不同,因此,在高質(zhì)量的場景和駕駛數(shù)據(jù)方面存在短板。
其次,生產(chǎn)高質(zhì)量數(shù)據(jù)需要大裝置算力基礎設施。動輒千萬Clips的高質(zhì)量數(shù)據(jù)回流,在數(shù)據(jù)存儲、算力資源等方面有著較高的規(guī)模門檻。目前特斯拉的Giga Texas數(shù)據(jù)中心的算力超過100 EFLOPS,國內(nèi)車企與之相比差距巨大。
再者,就技術而言,模仿學習的范式可以讓智駕技術做到接近人類但難超越人類。智駕技術要想超越人類智駕水平,必須在上述三個方面都實現(xiàn)超越,但國內(nèi)沒有哪個車企或智駕公司能夠做到如此。
年初DeepSeek的火爆給智能駕駛行業(yè)來了啟示,大模型訓練從模仿學習到強化學習這一思路被廣泛認可。DeepSeek-R1帶來的啟示是,通過少量高質(zhì)量數(shù)據(jù)的冷啟動,模型進行多階段的強化學習訓練,降低了數(shù)據(jù)規(guī)模的門檻。更重要的是,強化學習讓大模型有了長思維鏈能力,推理效果顯著提升,甚至可能具備超越人類的思維能力。同時,純強化學習訓練讓端到端智駕模型能夠探索多元場景和駕駛風格,最終讓自動駕駛技術超越人類。
據(jù)官方介紹,商湯絕影的R-UniAD端到端技術路線與DeepSeek技術思路同源。商湯絕影于2023年3月發(fā)布了UniAD端到端自動駕駛方案,2024年11月發(fā)布了“開悟”世界模型。
R-UniAD以高質(zhì)量數(shù)據(jù)冷啟動,用模仿學習訓練出一個端到端基礎模型,再通過強化學習方法進行訓練。通過小樣本多階段學習的技術,讓端到端自動駕駛的數(shù)據(jù)需求降低一個數(shù)量級。
在論壇現(xiàn)場,商湯絕影展示了“開悟”世界模型與主車閉環(huán)交互的方式。通過場景庫文件導入一個BEV視角下的初始主車和他車位置,世界模型自動生成主車視角下11V(11個攝像頭)的傳感器仿真數(shù)據(jù),端到端模型接收到這一數(shù)據(jù)后,生成主車下一時刻位置并進行反饋,世界模型根據(jù)刷新的主車位置和預測的他車位置渲染新的11V傳感器仿真數(shù)據(jù)。
值得一提的是,因為高質(zhì)量數(shù)據(jù)的生成需要更高的算力,相比其他競爭者,商湯絕影的優(yōu)勢在于,其既擁有大裝置算力基礎設施,又有云端自動駕駛大模型。
依托商湯科技,商湯絕影可汲取的算力達20 EFLOPS,而目前“蔚小理(蔚來、理想、
小鵬)”三家新勢力公布的算力數(shù)據(jù)總和還不到10 EFLOPS。商湯絕影“開悟”世界模型的1個GPU產(chǎn)生的仿真數(shù)據(jù)相當于500臺量產(chǎn)車的數(shù)據(jù)采集效果,商湯絕影擁有超5.4萬塊GPU。
在2025年4月即將到來的上海車展上,商湯絕影將正式發(fā)布R-UniAD端到端自動駕駛方案,量產(chǎn)的端到端智駕方案預計在今年年底交付落地。
評論