0
本文作者: 李雨晨 | 2024-05-10 17:40 |
今年年初,F(xiàn)SD推送了V12.3版本,標志著特斯拉的純視覺自動駕駛系統(tǒng)進入了一個新的階段。
4月28日馬斯克訪華,在不到24小時的時間里,特斯拉中國先后兩次在官方微博發(fā)聲,均提及加速自動駕駛技術(shù)落地。這在智駕圈和車企圈內(nèi)再次掀起一輪討論——智能化,仍然是當下最熱門的話題之一。
國內(nèi),從一開始就走純視覺路線的一個車企玩家是極越。
在2024北京車展上,極越汽車旗下的第二款車型——極越07首發(fā)亮相,并將于下半年正式上市。
智能化是極越一直想要傳達給外界的形象。近日,極越發(fā)布2024五一假期AI出行報告,數(shù)據(jù)統(tǒng)計時間為4月30日至5月5日。極越的智駕滲透率達78.8%,單車平均 PPA 里程為181.6公里;自動泊車功能滲透率達73.1%,單車單日自動泊車最多達20次。
車展期間,雷峰網(wǎng)參加了極越汽車高層群訪,與極越智能軟件副總裁潘云鵬展開交流。
潘云鵬表示,“我們現(xiàn)在是全中國唯一,全世界唯二純視覺高階輔助駕駛的方案?!?/p>
與在車展之前英偉達吳新宙所分享的類似觀點,潘云鵬也強調(diào)了“軟件定義汽車”以及“AI定義汽車”的區(qū)別:前者成功的要素是SOA軟硬解耦、高算力SOC,以及軟硬件背后所帶來的組織架構(gòu)的優(yōu)化;后者則是需要高質(zhì)量數(shù)據(jù)、大算力、大參數(shù)模型,靠的就是Scaling Laws(大力出奇跡)。
極越把自己的汽車定位成“汽車機器人”,這個汽車機器人具備三大基礎(chǔ)能力:自然交流、自由移動、自我成長。其中,在自由移動層面,主要包括兩個部分:行泊一體以及純視覺。
極越一開始所投入的純視覺智駕路線,已經(jīng)成為行業(yè)主流,很多廠商推出了沒有激光雷達的方案。
2023年,小鵬和蔚來分別宣布各自的第二品牌——MONA和樂道,明確采用純視覺路線。今年4月新發(fā)布的智界S7,個別車型也取消激光雷達,用視覺直接實現(xiàn)全國高速和城市快速路智駕領(lǐng)航輔助和智能泊車。
極越技術(shù)架構(gòu)
廣汽集團也正式推出了無圖純視覺智能駕駛技術(shù),目前在廣州核心城區(qū)的高速、城市NOA功能已經(jīng)基本實現(xiàn)無圖純視覺。
潘云鵬表示,在極越01的開發(fā)階段,是保留了激光雷達的,在保險杠燈下面的位置。后來,極越?jīng)Q定要去掉激光雷達,主要有幾個方面的原因:
第一,從人類駕駛的模式來看,頭上沒頂一個主動光傳感器,還是通過視覺,人腦手腳配合形成一個動作。車上的攝像頭包括毫米波雷達的覆蓋范圍比人類廣,完全可以替代掉額外的激光雷達,完成駕駛的動作。
第二,激光雷達的成本問題,即便成本下降很快,但比起攝像頭還是有很大差別,BOM成本是攝像頭的5-10倍。售后維修成本高。
第三,當激光雷達給的結(jié)果和其它感知的結(jié)果不一致時,難以仲裁。而且激光得滿足光學基本的物理屬性,在一些有金屬表面反射比較強的場景之下,必須得消除偽影和鬼影,這些東西的長尾效應(yīng)比較明顯,需要導入大量的成本。
第四,激光雷達的布置,現(xiàn)在車企基本都是把激光雷達放在車頂,這個對設(shè)計提出挑戰(zhàn)。
在背靠百度智駕能力、積累了一億公里數(shù)據(jù)以后,極越在2023年決定徹底舍棄激光雷達。當然,純視覺方案的挑戰(zhàn)也很明顯:深度信息的天然缺失,需要花費大量精力進行數(shù)據(jù)的升維,從2D到3D進行轉(zhuǎn)換。
潘云鵬在2023年的時候判斷,2024年是一個拐點?!皬娜ツ?0月27號發(fā)布這款車1.1版本,到現(xiàn)在的1.4版本,以及即將推出的1.5版本,每一個版本都會發(fā)現(xiàn)它的視覺性能,包括智駕的體驗都極大提升,這也印證了我們當年對視覺路線的判斷,一旦拐點到來之后,它的迭代周期頻率更敏捷?!?/p>
潘云鵬表示,“(智能駕駛)這個行業(yè)里觀點越來越類似,有幾個關(guān)鍵詞,一個是去圖化,一個是激光雷達,還有一個端到端。做純視覺方案時,大家會聊激光雷達會聊成本和可靠性,我們純視覺把售后成本壓低,但是研發(fā)成本是提高的,對數(shù)據(jù)量提升,對算力的要求越來越大,總體而言,一定是每家公司根據(jù)自己的特點選擇的最合適的路線。
純視覺的上限高,但是下限也低,一切取決于數(shù)據(jù)和算力的支撐。
比如,特斯拉今年1月剛剛追加了5億美元新投資,購買約1萬個英偉達H100 GPU,用于自動駕駛的訓練。有數(shù)據(jù)顯示,特斯拉擁有H100 GPU的數(shù)量可能超過3萬個。
抵達北京的那天,馬斯克就說,今年特斯拉將會投資約100億美元用于AI的訓練和推理,而推理主要用于汽車。而任何支出達不到每年100億美元水平或者無法高效部署的公司,都無法在市場上競爭。
極越的視覺大模型,包含了四大基礎(chǔ)能力:
第一,把之前的智駕小模型匯集成更大的大模型。原先每個功能都有自己的感知模型、控制模型,預測模型。極越01上對這些模型做了重構(gòu),有一個比較大的基礎(chǔ)模型。這個基礎(chǔ)模型具備幾個能力,一,具備在線繪圖的能力,是幫助極越去泛化、開城,主要是應(yīng)對地圖數(shù)據(jù)不完善、不準確的場景,可以做一些實時線圖,這是為什么極越可以很快開放全國的原因之一。
第二,目標監(jiān)測和持續(xù)跟蹤,對行人的目標軌跡,行人識別,可以做到持續(xù)的追蹤,持續(xù)的預測,讓車有一些預處理的能力,而不是變成“鬼探頭”的場景。
第三,OCC的占用網(wǎng)絡(luò)。不需要對障礙物進行識別,直接看到在目前的行駛區(qū)域或者行駛路徑被遮擋后繞開,極大的提升障礙物檢測和安全性能。
今年1月,在極越預告的V1.3版本OTA中,加入OCC占用網(wǎng)絡(luò)的“BEV+OCC+Transformer”智能駕駛方案,被正式命名為“B.O.T三向箔”。
相較于目前市場主流的“BEV+ Transformer”方案,OCC技術(shù)為整車智駕帶來的最大變化是感知識別能力的提升,能夠?qū)φ系K物進行3D精細刻畫,模型精度可達厘米級,比肩甚至超越激光雷達。
最后是場景理解,基于所有基礎(chǔ)能力的加持,可以對每幀視頻的數(shù)據(jù)做出最準確的判斷,跟看圖說話類似,可以幫助智駕在預測和溝通的過程中,做出更好的判斷。
潘云鵬表示,“在合并一些模型之后,發(fā)現(xiàn)它的性能有很大的提升,算力要求在減小,因為我們之前小模型的數(shù)量比較多,而且得益于數(shù)據(jù)訓練之后,所有的行車和泊車場景都有收益,這也是感知和基礎(chǔ)的大模型帶來自動駕駛泛化能力和性能提升的例子。”
據(jù)雷峰網(wǎng)了解,PPA開通之后的日均滲透率在50%,極越將會在5月中旬發(fā)布1.5版本。
在開城計劃上,今年極越的PPA功能將實現(xiàn)全國都能開。具體來講,將先開放一百個城市,主要是用戶最多的一些地方,在未來的一到兩個月逐步開放到300至360城的范圍,到2024年,所有的鄉(xiāng)間道路都能開。
具體的車輛功能上,自動轉(zhuǎn)向燈和屏幕換擋也用到純視覺的能力。
1.4版本的時候,極越通過車的角度判斷是否有變道的意圖,從而控制轉(zhuǎn)向燈以及屏幕換擋。潘云鵬表示,極越很快還有自動換擋的功能,通過視覺的能力,知道車主想前進還是后退,對視覺的范疇進行進一步豐富
2024北京車展上,我們能看到,許多車企在智能化上持續(xù)發(fā)力,技術(shù)的演變節(jié)奏不斷加快。
潘云鵬表示,“技術(shù)越有多樣性,對用戶來講是個好事,最后還是用戶體驗來說話,用數(shù)據(jù)來說話。最終應(yīng)該是百花齊放,純視覺、非純視覺、5顆激光雷達,8顆激光雷達,這都不重要,只要用戶的成本是可接受的,體驗是安全舒心的,這都是挺好的?!?span style="color: #FFFFFF;">雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。