丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給詩(shī)琪
發(fā)送

0

先讓 AI 學(xué)會(huì)害怕,再讓它握緊方向盤(pán)

本文作者: 詩(shī)琪   2025-07-17 19:01
導(dǎo)語(yǔ):以VLA模型,推動(dòng)智駕從執(zhí)行走向思考

元戎啟行研發(fā)VLA模型,在智能駕駛無(wú)人區(qū)開(kāi)啟“瘋狂冒險(xiǎn)”。從概念到落地,他們用堅(jiān)持詮釋技術(shù)信仰,讓智能駕駛從“執(zhí)行”邁向“思考”。

破局:從路牌困惑到“讀懂”世界

2024年6月的一個(gè)炎熱下午,周光乘坐測(cè)試車(chē)經(jīng)過(guò)公司附近的一處紅綠燈,一個(gè)不起眼的交通牌提示"車(chē)輛左轉(zhuǎn)不受燈控",測(cè)試車(chē)依舊停下等待紅燈變綠。

那一刻,他盯著后視鏡里不斷鳴笛的車(chē)輛,意識(shí)到:人類司機(jī)能瞬間理解這類特殊場(chǎng)景,但即便是當(dāng)時(shí)最接近人類駕駛能力的端到端模型,也因無(wú)法理解文字路牌未能通過(guò)。

這個(gè)問(wèn)題在他心里種下了一顆種子,后續(xù)的內(nèi)部會(huì)議上,他與研發(fā)團(tuán)隊(duì)幾次提起這個(gè)問(wèn)題。

先讓 AI 學(xué)會(huì)害怕,再讓它握緊方向盤(pán)

與此同時(shí),元戎啟行正在探索通用人工智能的多元路徑。RoadAGI實(shí)驗(yàn)室里誕生了VLA原型,它具備環(huán)境語(yǔ)義理解能力,能完成取放物品、避障行走等簡(jiǎn)單任務(wù)。

在一次Demo演示中,周光發(fā)現(xiàn)這個(gè)能根據(jù)環(huán)境信息和語(yǔ)言指令自主決策動(dòng)作的模型,與需要解讀復(fù)雜路況的智能駕駛模型有著驚人的相似性,不同的是它能夠理解語(yǔ)義信息。

這給了他很大啟發(fā),仿佛密碼鎖最后齒軌的咬合,思路迷宮轟然中開(kāi)。隨著ChatGPT等大語(yǔ)言模型爆發(fā),周光與團(tuán)隊(duì)更加確定:當(dāng)現(xiàn)階段端到端模型陷入corner case泥潭時(shí),融合語(yǔ)言理解的VLA或許能開(kāi)辟新航道——這不是簡(jiǎn)單的技術(shù)疊加,而是讓機(jī)器真正開(kāi)始“讀懂”物理世界。

2024年9月,元戎啟行將VLA模型提升為公司級(jí)研發(fā)項(xiàng)目。

在技術(shù)發(fā)展的浪潮中,時(shí)間往往至關(guān)重要,這是一場(chǎng)早于行業(yè)的“技術(shù)豪賭”。引領(lǐng)者從不等“風(fēng)口”,而是提前看見(jiàn)風(fēng)的方向。

元戎啟行作為一家人工智能企業(yè),始終相信AI技術(shù)將重塑生產(chǎn)力關(guān)系,引領(lǐng)第四次工業(yè)革命的到來(lái)。在眾多AI衍生應(yīng)用中,元戎啟行選擇智能駕駛作為突破口,因?yàn)樗艽蚱茢?shù)字與物理世界的壁壘。

隨著輔助駕駛技術(shù)大規(guī)模上車(chē)應(yīng)用,元戎啟行打造的基座模型將借助駕駛行為與物理世界深度交互,進(jìn)而洞悉其運(yùn)作規(guī)律。無(wú)論是“無(wú)圖”方案、端到端模型,還是VLA模型,元戎啟行始終圍繞AI技術(shù)解決問(wèn)題。

但最難的從來(lái)不是技術(shù)本身,而是在無(wú)人區(qū)找到那條對(duì)的路。VLA模型的出現(xiàn),讓智能駕駛從“執(zhí)行者”邁向了“思考者”——它開(kāi)始理解“為什么這樣開(kāi)”,而不僅僅是“怎么開(kāi)”。

這是VLA模型的優(yōu)勢(shì),也是研發(fā)之路的開(kāi)始。


攻堅(jiān):在荊棘中定義“安全”邊界

當(dāng)決定了新的技術(shù)方向,大家都興奮不已,希望作為行業(yè)技術(shù)引領(lǐng)者,率先研發(fā)出更好用的智能駕駛方案。但當(dāng)著手開(kāi)始做,才發(fā)現(xiàn)了重重困難。

一方面,VLA在智能駕駛領(lǐng)域研究應(yīng)用少,可參考的專業(yè)知識(shí)匱乏,研發(fā)人員需大量閱讀資料后逐步摸索;另一方面,公司面臨客戶量產(chǎn)壓力,主線資源傾向量產(chǎn)項(xiàng)目,且新技術(shù)效果有不確定性,VLA研發(fā)只能保守推進(jìn),進(jìn)度緩慢。

"最開(kāi)始,我們都被VLA的'語(yǔ)言天賦'迷住了。"產(chǎn)品經(jīng)理石杰回憶道。

VLA模型具備強(qiáng)大的文字理解及OCR識(shí)別能力,團(tuán)隊(duì)投入大量精力攻克潮汐車(chē)道、可變車(chē)道、待轉(zhuǎn)區(qū)等文字理解場(chǎng)景。

先讓 AI 學(xué)會(huì)害怕,再讓它握緊方向盤(pán)

當(dāng)測(cè)試車(chē)順利通過(guò)當(dāng)初困擾大家的“車(chē)輛左轉(zhuǎn)不受燈控”指示牌,并給出文字解釋其駕駛決策過(guò)程時(shí),車(chē)上的人非常激動(dòng),這解決了現(xiàn)階段端到端系統(tǒng)的“黑盒”問(wèn)題,通過(guò)思維鏈(CoT)實(shí)現(xiàn)透明化推理,極大增強(qiáng)用戶的信任度。

同時(shí),VLA模型在互聯(lián)網(wǎng)學(xué)習(xí)海量知識(shí),能夠處理很多corner cases,例如識(shí)別超載小貨車(chē)、路面上的輪胎等等;還可以通過(guò)語(yǔ)音交互控車(chē),實(shí)時(shí)對(duì)話?cǎi){馭車(chē)輛。

然而,一次測(cè)試中的驚險(xiǎn)一幕,讓所有人對(duì)VLA的期待有所轉(zhuǎn)變。

測(cè)試車(chē)在橋洞正要左轉(zhuǎn),目之所及沒(méi)有任何車(chē)輛,測(cè)試車(chē)勻速前進(jìn),突然竄出一個(gè)外賣(mài)騎手迫使車(chē)輛緊急重剎,車(chē)上的人都嚇了一跳。大家反思如果是老司機(jī)開(kāi)車(chē),一定會(huì)在橋洞盲區(qū)提前減速避免風(fēng)險(xiǎn)。

這點(diǎn)醒了所有人,安全才是輔助駕駛的生命線,用戶需要的是一個(gè)真正安全的輔助駕駛系統(tǒng),能夠主動(dòng)預(yù)判和規(guī)避風(fēng)險(xiǎn),這比“語(yǔ)音交互”更為重要。

對(duì)整個(gè)場(chǎng)景的高級(jí)語(yǔ)義推理是目前端到端系統(tǒng)缺乏的,卻是VLA更擅長(zhǎng)的,這一刻,“防御性駕駛”成為VLA模型的核心進(jìn)化方向。


技術(shù)可以不斷突破極限,但安全永遠(yuǎn)是我們的底線。在安全、效率和舒適中,我們努力找到一種平衡,讓輔助駕駛成為用戶日常愛(ài)用的出行方式。

研發(fā)之路也充滿技術(shù)攻堅(jiān),VLA模型研發(fā)人員肖毅正在摸索。VLA模型的研發(fā)要經(jīng)歷架構(gòu)設(shè)計(jì)、數(shù)據(jù)探索和規(guī)?;⒛P万?yàn)證、部署上車(chē)、持續(xù)迭代等流程。在架構(gòu)設(shè)計(jì)時(shí),起初肖毅計(jì)劃云端推理,將大語(yǔ)言模型部署云端,數(shù)據(jù)回傳至車(chē)端控車(chē),但實(shí)車(chē)上路云端到車(chē)端的時(shí)延太大,例如車(chē)速60km/h,假設(shè)時(shí)延需要2s,在拿到云端結(jié)果時(shí),車(chē)已經(jīng)向前跑了33米,在這期間實(shí)際路況已經(jīng)發(fā)生變化,對(duì)于需要及時(shí)響應(yīng)的場(chǎng)景,行駛安全將受到極大威脅。一個(gè)月后,研發(fā)團(tuán)隊(duì)放棄了云端推理,改為本地部署模型。

先讓 AI 學(xué)會(huì)害怕,再讓它握緊方向盤(pán)

對(duì)車(chē)端有限的算力來(lái)說(shuō),模型車(chē)端部署給模型設(shè)計(jì)、模型加速以及部署優(yōu)化都帶來(lái)了全新挑戰(zhàn)。研發(fā)團(tuán)隊(duì)壓縮了詞表,對(duì)模型做了剪枝(pruning)和加速,同時(shí)元戎啟行強(qiáng)大的推理引擎團(tuán)隊(duì)對(duì)VLA模型做了大量的算子優(yōu)化、顯存優(yōu)化、硬件新特性適配等,最終使得VLA在車(chē)端順暢地跑起來(lái)。

當(dāng)然,還有另一個(gè)更大的挑戰(zhàn)。數(shù)據(jù)是一切AI模型的基礎(chǔ),大規(guī)模的高質(zhì)量數(shù)據(jù)對(duì)VLA模型來(lái)說(shuō)是重中之重,靠人工標(biāo)注,效率極低。后來(lái)肖毅通過(guò)迭代大模型自動(dòng)給數(shù)據(jù)打標(biāo)簽,解決了數(shù)據(jù)規(guī)模標(biāo)注難題,目前元戎啟行也達(dá)到了千萬(wàn)級(jí)Clips的數(shù)據(jù)規(guī)模。

"現(xiàn)在行業(yè)都在追逐大模型,但真正稀缺的是對(duì)駕駛本質(zhì)的理解。"周光常對(duì)團(tuán)隊(duì)強(qiáng)調(diào)。當(dāng)行業(yè)忙著給系統(tǒng)加載更多語(yǔ)料庫(kù)時(shí),元戎啟行的VLA正在深度學(xué)習(xí)"如何在不完美的人類駕駛環(huán)境中做出最安全決策"——這才是AI司機(jī)的靈魂。


領(lǐng)航:駛向更安心的AI時(shí)代

今年,將有超5款搭載元戎啟行VLA模型的車(chē)量產(chǎn),首款車(chē)8月即將上路。

“對(duì)于VLA,我期待可以應(yīng)用到Robotaxi上,成為真正的AI司機(jī),讓用戶在安靜環(huán)境中與它直接溝通。它不僅能響應(yīng)指令,還能主動(dòng)守護(hù)安全?!敝芄庹f(shuō)到。

隨著VLA模型的迭代與應(yīng)用,我們期待它不僅能成為用戶的“AI司機(jī)”,更能推動(dòng)整個(gè)行業(yè)向更安全、更透明的智能駕駛時(shí)代邁進(jìn)。讓每一次出行,都更安心、更自在。

VLA的研發(fā),是元戎啟行技術(shù)信仰的縮影。不做追隨者,只做定義者,這條路很難,但值得。

穿行于行業(yè)發(fā)展的驚濤駭浪,元戎啟行深知VLA不過(guò)是航程中的臨時(shí)錨點(diǎn),唯以技術(shù)研發(fā)為壓艙石,才能于風(fēng)浪中穩(wěn)馭船身,航向人類智慧深處。

未來(lái),元戎啟行將不局限于汽車(chē)載體,致力于訓(xùn)練更先進(jìn)的AI模型賦能多種智能體,實(shí)現(xiàn)任意點(diǎn)到點(diǎn)的移動(dòng)能力,先達(dá)成RoadAGI(道路通用人工智能),最終邁向通用人工智能,點(diǎn)燃人類生產(chǎn)力的質(zhì)變奇點(diǎn)。


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)