對話極越智能軟件副總裁潘云鵬：今年P(guān)PA功能全國都能開，5月中旬發(fā)布OTA V1.5版本

本文作者：李雨晨

2024-05-10 17:40

導(dǎo)語：智能化是極越一直想要傳達(dá)給外界的形象。

今年年初，F(xiàn)SD推送了V12.3版本，標(biāo)志著特斯拉的純視覺自動駕駛系統(tǒng)進(jìn)入了一個(gè)新的階段。

4月28日馬斯克訪華，在不到24小時(shí)的時(shí)間里，特斯拉中國先后兩次在官方微博發(fā)聲，均提及加速自動駕駛技術(shù)落地。這在智駕圈和車企圈內(nèi)再次掀起一輪討論——智能化，仍然是當(dāng)下最熱門的話題之一。

國內(nèi)，從一開始就走純視覺路線的一個(gè)車企玩家是極越。

在2024北京車展上，極越汽車旗下的第二款車型——極越07首發(fā)亮相，并將于下半年正式上市。

智能化是極越一直想要傳達(dá)給外界的形象。近日，極越發(fā)布2024五一假期AI出行報(bào)告，數(shù)據(jù)統(tǒng)計(jì)時(shí)間為4月30日至5月5日。極越的智駕滲透率達(dá)78.8%，單車平均 PPA 里程為181.6公里；自動泊車功能滲透率達(dá)73.1%，單車單日自動泊車最多達(dá)20次。

對話極越智能軟件副總裁潘云鵬：今年P(guān)PA功能全國都能開，5月中旬發(fā)布OTA V1.5版本

車展期間，雷峰網(wǎng)參加了極越汽車高層群訪，與極越智能軟件副總裁潘云鵬展開交流。

極越為什么走純視覺路線？

潘云鵬表示，“我們現(xiàn)在是全中國唯一，全世界唯二純視覺高階輔助駕駛的方案。”

與在車展之前英偉達(dá)吳新宙所分享的類似觀點(diǎn)，潘云鵬也強(qiáng)調(diào)了“軟件定義汽車”以及“AI定義汽車”的區(qū)別：前者成功的要素是SOA軟硬解耦、高算力SOC，以及軟硬件背后所帶來的組織架構(gòu)的優(yōu)化；后者則是需要高質(zhì)量數(shù)據(jù)、大算力、大參數(shù)模型，靠的就是Scaling Laws（大力出奇跡）。

極越把自己的汽車定位成“汽車機(jī)器人”，這個(gè)汽車機(jī)器人具備三大基礎(chǔ)能力：自然交流、自由移動、自我成長。其中，在自由移動層面，主要包括兩個(gè)部分：行泊一體以及純視覺。

極越一開始所投入的純視覺智駕路線，已經(jīng)成為行業(yè)主流，很多廠商推出了沒有激光雷達(dá)的方案。

2023年，小鵬和蔚來分別宣布各自的第二品牌——MONA和樂道，明確采用純視覺路線。今年4月新發(fā)布的智界S7，個(gè)別車型也取消激光雷達(dá)，用視覺直接實(shí)現(xiàn)全國高速和城市快速路智駕領(lǐng)航輔助和智能泊車。

對話極越智能軟件副總裁潘云鵬：今年P(guān)PA功能全國都能開，5月中旬發(fā)布OTA V1.5版本

極越技術(shù)架構(gòu)

廣汽集團(tuán)也正式推出了無圖純視覺智能駕駛技術(shù)，目前在廣州核心城區(qū)的高速、城市NOA功能已經(jīng)基本實(shí)現(xiàn)無圖純視覺。

潘云鵬表示，在極越01的開發(fā)階段，是保留了激光雷達(dá)的，在保險(xiǎn)杠燈下面的位置。后來，極越?jīng)Q定要去掉激光雷達(dá)，主要有幾個(gè)方面的原因：

第一，從人類駕駛的模式來看，頭上沒頂一個(gè)主動光傳感器，還是通過視覺，人腦手腳配合形成一個(gè)動作。車上的攝像頭包括毫米波雷達(dá)的覆蓋范圍比人類廣，完全可以替代掉額外的激光雷達(dá)，完成駕駛的動作。

第二，激光雷達(dá)的成本問題，即便成本下降很快，但比起攝像頭還是有很大差別，BOM成本是攝像頭的5-10倍。售后維修成本高。

第三，當(dāng)激光雷達(dá)給的結(jié)果和其它感知的結(jié)果不一致時(shí)，難以仲裁。而且激光得滿足光學(xué)基本的物理屬性，在一些有金屬表面反射比較強(qiáng)的場景之下，必須得消除偽影和鬼影，這些東西的長尾效應(yīng)比較明顯，需要導(dǎo)入大量的成本。

第四，激光雷達(dá)的布置，現(xiàn)在車企基本都是把激光雷達(dá)放在車頂，這個(gè)對設(shè)計(jì)提出挑戰(zhàn)。

在背靠百度智駕能力、積累了一億公里數(shù)據(jù)以后，極越在2023年決定徹底舍棄激光雷達(dá)。當(dāng)然，純視覺方案的挑戰(zhàn)也很明顯：深度信息的天然缺失，需要花費(fèi)大量精力進(jìn)行數(shù)據(jù)的升維，從2D到3D進(jìn)行轉(zhuǎn)換。

潘云鵬在2023年的時(shí)候判斷，2024年是一個(gè)拐點(diǎn)?！皬娜ツ?0月27號發(fā)布這款車1.1版本，到現(xiàn)在的1.4版本，以及即將推出的1.5版本，每一個(gè)版本都會發(fā)現(xiàn)它的視覺性能，包括智駕的體驗(yàn)都極大提升，這也印證了我們當(dāng)年對視覺路線的判斷，一旦拐點(diǎn)到來之后，它的迭代周期頻率更敏捷?！?/p>

PPA日均滲透率50%，5月中旬發(fā)布1.5版本

潘云鵬表示，“（智能駕駛）這個(gè)行業(yè)里觀點(diǎn)越來越類似，有幾個(gè)關(guān)鍵詞，一個(gè)是去圖化，一個(gè)是激光雷達(dá)，還有一個(gè)端到端。做純視覺方案時(shí)，大家會聊激光雷達(dá)會聊成本和可靠性，我們純視覺把售后成本壓低，但是研發(fā)成本是提高的，對數(shù)據(jù)量提升，對算力的要求越來越大，總體而言，一定是每家公司根據(jù)自己的特點(diǎn)選擇的最合適的路線。

純視覺的上限高，但是下限也低，一切取決于數(shù)據(jù)和算力的支撐。

比如，特斯拉今年1月剛剛追加了5億美元新投資，購買約1萬個(gè)英偉達(dá)H100 GPU，用于自動駕駛的訓(xùn)練。有數(shù)據(jù)顯示，特斯拉擁有H100 GPU的數(shù)量可能超過3萬個(gè)。

抵達(dá)北京的那天，馬斯克就說，今年特斯拉將會投資約100億美元用于AI的訓(xùn)練和推理，而推理主要用于汽車。而任何支出達(dá)不到每年100億美元水平或者無法高效部署的公司，都無法在市場上競爭。

極越的視覺大模型，包含了四大基礎(chǔ)能力：

第一，把之前的智駕小模型匯集成更大的大模型。原先每個(gè)功能都有自己的感知模型、控制模型，預(yù)測模型。極越01上對這些模型做了重構(gòu)，有一個(gè)比較大的基礎(chǔ)模型。這個(gè)基礎(chǔ)模型具備幾個(gè)能力，一，具備在線繪圖的能力，是幫助極越去泛化、開城，主要是應(yīng)對地圖數(shù)據(jù)不完善、不準(zhǔn)確的場景，可以做一些實(shí)時(shí)線圖，這是為什么極越可以很快開放全國的原因之一。

第二，目標(biāo)監(jiān)測和持續(xù)跟蹤，對行人的目標(biāo)軌跡，行人識別，可以做到持續(xù)的追蹤，持續(xù)的預(yù)測，讓車有一些預(yù)處理的能力，而不是變成“鬼探頭”的場景。

第三，OCC的占用網(wǎng)絡(luò)。不需要對障礙物進(jìn)行識別，直接看到在目前的行駛區(qū)域或者行駛路徑被遮擋后繞開，極大的提升障礙物檢測和安全性能。

今年1月，在極越預(yù)告的V1.3版本OTA中，加入OCC占用網(wǎng)絡(luò)的“BEV+OCC+Transformer”智能駕駛方案，被正式命名為“B.O.T三向箔”。

相較于目前市場主流的“BEV+ Transformer”方案，OCC技術(shù)為整車智駕帶來的最大變化是感知識別能力的提升，能夠?qū)φ系K物進(jìn)行3D精細(xì)刻畫，模型精度可達(dá)厘米級，比肩甚至超越激光雷達(dá)。

最后是場景理解，基于所有基礎(chǔ)能力的加持，可以對每幀視頻的數(shù)據(jù)做出最準(zhǔn)確的判斷，跟看圖說話類似，可以幫助智駕在預(yù)測和溝通的過程中，做出更好的判斷。

潘云鵬表示，“在合并一些模型之后，發(fā)現(xiàn)它的性能有很大的提升，算力要求在減小，因?yàn)槲覀冎靶∧Ｐ偷臄?shù)量比較多，而且得益于數(shù)據(jù)訓(xùn)練之后，所有的行車和泊車場景都有收益，這也是感知和基礎(chǔ)的大模型帶來自動駕駛泛化能力和性能提升的例子?！?/p>

據(jù)雷峰網(wǎng)(公眾號：雷峰網(wǎng))了解，PPA開通之后的日均滲透率在50%，極越將會在5月中旬發(fā)布1.5版本。

在開城計(jì)劃上，今年極越的PPA功能將實(shí)現(xiàn)全國都能開。具體來講，將先開放一百個(gè)城市，主要是用戶最多的一些地方，在未來的一到兩個(gè)月逐步開放到300至360城的范圍，到2024年，所有的鄉(xiāng)間道路都能開。

具體的車輛功能上，自動轉(zhuǎn)向燈和屏幕換擋也用到純視覺的能力。

1.4版本的時(shí)候，極越通過車的角度判斷是否有變道的意圖，從而控制轉(zhuǎn)向燈以及屏幕換擋。潘云鵬表示，極越很快還有自動換擋的功能，通過視覺的能力，知道車主想前進(jìn)還是后退，對視覺的范疇進(jìn)行進(jìn)一步豐富

2024北京車展上，我們能看到，許多車企在智能化上持續(xù)發(fā)力，技術(shù)的演變節(jié)奏不斷加快。

潘云鵬表示，“技術(shù)越有多樣性，對用戶來講是個(gè)好事，最后還是用戶體驗(yàn)來說話，用數(shù)據(jù)來說話。最終應(yīng)該是百花齊放，純視覺、非純視覺、5顆激光雷達(dá)，8顆激光雷達(dá)，這都不重要，只要用戶的成本是可接受的，體驗(yàn)是安全舒心的，這都是挺好的?！?span style="color: #FFFFFF;">雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章