丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
智能駕駛 正文
發(fā)私信給韋艷嬌
發(fā)送

0

對話何小鵬:在物理AI時代,數(shù)據(jù)是新的石油

本文作者: 韋艷嬌   2025-11-12 10:21
導(dǎo)語:“汽車、Robotaxi、機(jī)器人、飛行汽車,將會為小鵬帶來更多「石油」。?”

那些天馬行空的科技暢想,都正在從夢想變成現(xiàn)實(shí)。

11月5日,第七屆小鵬科技日如期進(jìn)行,活動地在小鵬新搬遷的總部園區(qū)。從早期蝸居廣州城中村的創(chuàng)業(yè)團(tuán)隊(duì),到如今擁有自建科技園區(qū),辦公地點(diǎn)的變化背后,也藏著小鵬成立11周年后從站穩(wěn)到跑向世界的愿景。

小鵬汽車正變得更像一家AI公司。

它將業(yè)務(wù)聚焦在四個方向:智能汽車、機(jī)器人、Robotaxi與飛行汽車。這四個板塊并非簡單并列,而是以智能駕駛為核心的不同演化路徑。汽車是商業(yè)化起點(diǎn),Robotaxi是算法的城市化延伸,機(jī)器人與飛行汽車則是具身智能和空間智能的外溢結(jié)果。

其中,小鵬汽車推出了首個量產(chǎn)物理世界大模型即第二代VLA,這也是小鵬在物理AI領(lǐng)域探索的關(guān)鍵技術(shù)突破。在何小鵬看來,當(dāng)AI將進(jìn)一步進(jìn)化,AI將不再僅停留于應(yīng)答與生成,而是直接參與、引導(dǎo)甚至重塑物理世界的運(yùn)行,AI的能力要從數(shù)字世界延伸至物理世界。

相較于傳統(tǒng)的行業(yè)標(biāo)準(zhǔn)版的VLA,小鵬二代VLA去掉了語言這一中間轉(zhuǎn)譯環(huán)節(jié)。減少了語言轉(zhuǎn)譯的延遲后,視覺信號直達(dá)動作指令,并且小鵬二代VLA使用大量的長尾視頻數(shù)據(jù),大模型從學(xué)習(xí)模仿變成更聰明的理解。

二代VLA帶來的機(jī)器逐步理解、交互和改變世界的能力,也是小鵬串聯(lián)起汽車、機(jī)器人、飛行汽車等多元業(yè)務(wù)線的信心來源,因?yàn)樗鼈兯鎸Φ亩际峭粋€物理世界,所需要解決也都是基于物理世界信息進(jìn)行決策。

據(jù)小鵬汽車聯(lián)合創(chuàng)始人、執(zhí)行董事、董事長兼CEO何小鵬透露,第二代VLA的突破性進(jìn)展經(jīng)歷了一段極具挑戰(zhàn)的研發(fā)攻堅(jiān)。

2024年,小鵬內(nèi)部同時研發(fā)兩代VLA,卻一直沒有取得突破,研發(fā)團(tuán)隊(duì)面臨巨大的壓力,研發(fā)過程充滿了不確定性。然而,在團(tuán)隊(duì)堅(jiān)持不懈的努力下,二代VLA突然呈現(xiàn)出驚喜的理解能力。小鵬內(nèi)部認(rèn)為,這種變化源于技術(shù)積累觸及某個臨界點(diǎn)后的自然爆發(fā)。

何小鵬表示,二代VLA所展現(xiàn)出的物理AI能力只是一個開始。真正的難題不在于模型的涌現(xiàn),而在于能否更快實(shí)現(xiàn)穩(wěn)定量產(chǎn)。那意味著不僅要讓“長板”更長,還要讓中板和短板被一并補(bǔ)齊。量產(chǎn),是小鵬接下來必須跨過的門檻。

在他看來,物理AI將成為未來科技公司新的競爭。在物理AI時代,數(shù)據(jù)是新的石油,誰能先獲得大量高質(zhì)量數(shù)據(jù)并形成“數(shù)據(jù)-體驗(yàn)-更多數(shù)據(jù)”的閉環(huán),誰就能取得優(yōu)勢。而這一循環(huán)的起點(diǎn)與關(guān)鍵環(huán)節(jié),都取決于企業(yè)在硬件和工程化能力上的深度投入,最終構(gòu)成軟硬件協(xié)同演進(jìn)的閉環(huán)。

在這種思考下,小鵬將硬件業(yè)務(wù)從汽車延伸至機(jī)器人、飛行汽車、Robotaxi等板塊,或許會帶來更多數(shù)據(jù),形成更大的軟硬件循環(huán)能力。

小鵬推出Robotaxi業(yè)務(wù),則更多基于對未來出行的思考。何小鵬堅(jiān)信,未來的4個輪子交通一定是“共享”和“私享”的組合。

與此同時,第二代VLA大模型的成熟,也為小鵬切入這一市場提供了優(yōu)勢。二代VLA已具備擺脫高精地圖依賴的能力,可直接支持前裝量產(chǎn)方案,而非事后改造。同時,通過與量產(chǎn)車型共享研發(fā)體系,小鵬得以在保證性能的前提下分?jǐn)偝杀緣毫Γ瑢诬嚦杀究刂圃诟呓?jīng)濟(jì)性的區(qū)間。

在趨勢和條件都有利的邏輯下,小鵬基于現(xiàn)有的汽車業(yè)務(wù)去布局Robotaxi也非常合理。

何小鵬也明確,小鵬汽車的定位將切換為“面向全球的具身智能企業(yè)”,而不再只是一家中國車企。

除了更多業(yè)務(wù)面向更大市場的動作外,小鵬正將其部分核心技術(shù)以開源形式開放。其第二代VLA大模型面向全球商業(yè)伙伴開源,大眾汽車成為該技術(shù)的首發(fā)客戶,后續(xù)將推動第二代小鵬 VLA 和圖靈芯片,在大眾品牌車型上落地。

在商業(yè)化落地規(guī)劃中,何小鵬表示科技日上公布的多項(xiàng)技術(shù)將在2026年進(jìn)入爆發(fā)周期:第二代 VLA 端到端輔助駕駛、小路 NGP、無需導(dǎo)航漫游的 Super LCC、第二代人形機(jī)器人 IRON、前裝量產(chǎn) Robotaxi。

在科技日后,小鵬被稱為是最像特斯拉的企業(yè),小鵬汽車的市值回到220億美元,特斯拉的市值約為1.5萬億美元。

二者之間仍然有著巨大的差距,但從另一個角度看,小鵬在機(jī)器人、自動駕駛領(lǐng)域開放SDK,挖掘物理AI的數(shù)據(jù)石油,也在助其搶占物理AI高地。

在物理AI這條路徑上,小鵬有了更廣闊的向上空間。


圍繞物理AI、機(jī)器人、業(yè)務(wù)發(fā)展等內(nèi)容,雷峰網(wǎng)(公眾號:雷峰網(wǎng))等與小鵬汽車董事長何小鵬、小鵬汽車副董事長兼聯(lián)席總裁顧宏地、小鵬汽車自動駕駛中心組織負(fù)責(zé)人劉先明、小鵬汽車機(jī)器人副總裁及AI技術(shù)委員會負(fù)責(zé)人米良川進(jìn)行了多場交流。

以下是編輯后的內(nèi)容節(jié)選:


Q:小鵬為什么堅(jiān)持機(jī)器人“高度擬人化”?如果做高度擬人化,對應(yīng)非常高的投入成本,怎么做權(quán)衡和取舍?

何小鵬:未來高等級的機(jī)器人有各種各樣的形態(tài),有像人的,也有不像人的。

更擬人的機(jī)器人,有三大好處:第一,今天機(jī)器人想做到聰明,不能用規(guī)則,要用AI來驅(qū)動,只有從人類世界才可以學(xué)到最多的數(shù)據(jù)。

第二,我們的家庭、工廠,實(shí)際上大部分都是為了方便人類去使用而設(shè)計(jì)、建造、運(yùn)營的,所以如果它越像人,越容易適應(yīng)這個世界。

第三,從商業(yè)角度看,像人更容易讓大家有親和感,更有購買欲。賣得多帶來規(guī)模效應(yīng),成本更低,成本更低就可以賣得更多,會形成正向循環(huán)。

Q:為什么小鵬Robotaxi首個全球生態(tài)合作伙伴選擇了高德?第二個問題,明年要發(fā)布三款無人駕駛出租車,這三款車的差異在哪兒?

何小鵬:高德是中國非常大的出行生態(tài)平臺,小鵬跟很多Robotaxi公司不一樣,無論是在中國還是全球,都不追求自己的全力運(yùn)營。希望小鵬做Robotaxi就像一個“工具箱”一樣,有車、有軟件、有SDK接口,開放出來給合作伙伴,他拿著“工具箱”就能做本地Robotaxi的運(yùn)營。

高德是一個出行運(yùn)營商,所以它來運(yùn)營,我們提供“工具箱”,這是符合兩家戰(zhàn)略定位的。三款Robotaxi是不同價位的,提供5、6、7座,滿足不同用戶的需求。

Q:許多中國大公司常被拿來和特斯拉比較,但估值卻遠(yuǎn)低于特斯拉。在未來,我們應(yīng)當(dāng)如何讓資本市場更好地提升小鵬汽車的估值?

顧宏地:我們目前在追求的,其實(shí)更多的是科技和產(chǎn)品,確實(shí)其中有些和特斯拉比較類似。都聚焦于物理AI,同時聚焦打造智能汽車、自動駕駛、人形機(jī)器人等等。我們在部分領(lǐng)域甚至比特斯拉開始得更早,比如飛行汽車,人形機(jī)器人。某種程度上,我們是聚焦于使用技術(shù)和AI去打造更多物理世界的場景。

關(guān)于資本市場的估值,小鵬和特斯拉的現(xiàn)狀是非常不一樣的,其中有很多變量。

首先,中國和美國不同,在市場、科技公司、資本市場,有一些情況有所不同。第二,特斯拉是有一些優(yōu)勢的,尤其是他們在電動車領(lǐng)域開啟得更早,并且媒體曝光度也非常高。

特斯拉有不同的產(chǎn)品,電車只是一部分,同時他們也有AI模型、FSD,以及很多生態(tài)企業(yè),種種加起來可以組成他們的估值,小鵬也在不斷推出各種產(chǎn)品及技術(shù),希望小鵬在未來可以獲得一樣的國際聲望。

Q:小鵬的新一代機(jī)器人與汽車在零部件上的復(fù)用比例達(dá)到多少?

何小鵬:我沒有精確的答案,但是很多工藝是一樣的,比如說感知、域控制器大部分一樣,AI 軟件有70%是一樣的,但機(jī)器人的關(guān)節(jié)、皮膚在汽車零部件上是沒有的。

Q:小鵬希望在物理AI業(yè)務(wù)上,與汽車營收的占比是如何的?

何小鵬:未來,我對機(jī)器人的看法可能更樂觀。汽車在全球是10萬億美金的市場,一年生產(chǎn)9000萬臺車;而機(jī)器人是20萬億美金的市場。當(dāng)然它不會這么快(實(shí)現(xiàn)),可能需要10~20年的時間,在這個時候可能會有2億或者更多的人形機(jī)器人。

我沒有想過10年以后,一年能賣多少機(jī)器人,但肯定會超過汽車,超過100萬,這是從10年的角度來看。從短期的角度來看,機(jī)器人的量產(chǎn)還要過很多很多關(guān)。

Q:很多Robotaxi公司還沒有取得盈利,請問你們在推進(jìn)Robotaxi計(jì)劃時怎么確保有盈利?

何小鵬:小鵬可能是一個不一樣的Robotaxi公司,因?yàn)槲覀冏隽饲把b的車,做了量產(chǎn)的車。小鵬Robotaxi、同時還有一個Robo(私人L4),可以To C銷售,可以大幅度分?jǐn)侭OM和研發(fā)費(fèi)用。

另外,基于二代VLA,小鵬Robotaxi不需要高精地圖,不需要掃街,不需要激光雷達(dá),更像一個物理世界的人去思考,所以更廣度、更泛化,不需要部署費(fèi)用。小鵬汽車在Robotaxi領(lǐng)域,研發(fā)費(fèi)和BOM比其他公司天然擁有百分之幾十,甚至幾倍的優(yōu)勢。

Q:小鵬把VLA的“L”去掉了,是真的消除了嗎?如果真的消除了,你們現(xiàn)在還叫VLA,不應(yīng)該是叫VA嗎?

何小鵬:我們說V+L,轉(zhuǎn)譯環(huán)節(jié)沒有變成人類的語言跟格式,而是變成了一個物理世界的新語言,所以它不是人類可見、可認(rèn)知的語言,效率很好,更豐富。

Q:發(fā)布會現(xiàn)場沒有提到L3,直接面向L4,L3產(chǎn)品的進(jìn)展是不是也卡在這個法律法規(guī)上?

何小鵬:我認(rèn)為,將來一個是L2,一個是L4,沒有L3,跳躍了L3。

Q:小鵬把固態(tài)電池裝在人形機(jī)器人,這款固態(tài)電池是來自外部供應(yīng)商嗎?

何小鵬:我們不研發(fā)電芯,都用合作伙伴的,我們固態(tài)電池的電芯來自于兩家,一家來自海外,一家來自中國。

Q:為什么小鵬在這個時候啟動Robotaxi?目前有什么樣的策略?

何小鵬:因?yàn)槲覀兒芏郃I技術(shù)的開發(fā)、目前算力的提升,已經(jīng)能夠很好地去催生Robotaxi的機(jī)遇,和半年前、兩年前完全不一樣。

此外我們也看到,L4智駕越來越成熟。在過去6個月到一年當(dāng)中,很多公司以及行業(yè)合作都聚焦于L4級自動駕駛。當(dāng)我們?nèi)マD(zhuǎn)向L4、轉(zhuǎn)向Robotaxi的時候,目前的情況和半年甚至一年前是完全不一樣的。

對于小鵬來說,也想要提供更加經(jīng)濟(jì)的解決方案,來更好地幫助客戶享受到L4的便利性。目前,在Robotaxi領(lǐng)域,我們和很多生態(tài)合作伙伴合作。

Q:小鵬就展出了一個女性的人形機(jī)器人,為什么會是女性?這方面是出于哪些考量?

何小鵬:人形機(jī)器人是男是女不重要,就像你可以買黑顏色的車,也可以買白顏色的車。在第一代機(jī)器人里面,我希望完成一個男性、一個女性的機(jī)器人,我認(rèn)為都是需要的。

Q:特斯拉和小鵬是全球、全世界業(yè)務(wù)重合度最高的兩家公司,如果用一個詞概括,小鵬和特斯拉最不同的地方在哪里?

顧宏地:特斯拉和小鵬的對比中,有兩個特別的點(diǎn)。第一是我們相同的地方,我們都注重規(guī)模,做事時不希望只針對一個很小的細(xì)分市場,而是希望達(dá)到量產(chǎn)和規(guī)?;?,這是我們相同的地方。第二是我們不同的地方,小鵬是一個非常開放的生態(tài)。

更加開放的生態(tài)系統(tǒng)和更加封閉的系統(tǒng),都有自己的優(yōu)劣勢,比如封閉的可能更容易去獲得經(jīng)濟(jì)效益,開放的可能更容易和合作伙伴合作。

目前小鵬更加開放,因?yàn)槲覀兪且粋€年輕的公司,我們有自己的局限性,沒有資源去做很多事情。我們在機(jī)器人、在自動駕駛車上開放SDK,可以讓我們和更多人合作實(shí)現(xiàn)很多技術(shù),這樣也可以更好地去幫助我們的產(chǎn)品和技術(shù)成熟。

Q:發(fā)布會提到了機(jī)器人的一些場景,比如說擰螺絲、做家務(wù),這些可能都不是立刻會實(shí)現(xiàn)的場景,在你們看來,如果實(shí)現(xiàn)這些場景可能需要多少年?

何小鵬:在人形機(jī)器人上,不同的公司會選擇不同的商業(yè)化方案,在我們公司有一些規(guī)則,讓機(jī)器人不要有太多用手的操作,以及我們也想在機(jī)器人的智慧或者是智力方面,循序漸進(jìn)地發(fā)展。

目前我們還是在商業(yè)化早期階段,可能在3~5年之內(nèi)可以實(shí)現(xiàn)你剛剛提到的場景,可以做更多不同的事情。但如果我們想要機(jī)器人在家里去照顧老人、照顧小孩,那可能需要更久的時間,甚至可能需要5~10年。有些人說,5~10年之后,人類可能在很多場景下會被機(jī)器人取代,但在我看來,這是不可能實(shí)現(xiàn)的。

Q:業(yè)務(wù)線上,包括機(jī)器人、低空飛行器乃至Robotaxi,小鵬是如何看待它的國際化市場潛力?

何小鵬:小鵬的目標(biāo)是,接下來十年有一半產(chǎn)品在中國以外銷售。所有產(chǎn)品線和大部分的產(chǎn)品,我們都會考慮如何全球化。實(shí)際上,有部分的產(chǎn)品比如飛行汽車在全球的使用場景,可能比中國還多一點(diǎn)、還快一點(diǎn)。

Q:在智駕方面,小鵬在國外XNGP有沒有一些規(guī)劃?

何小鵬:在海外市場方面,小鵬也在積極推進(jìn)XNGP的落地進(jìn)程。目前,公司已對多個國家和地區(qū)進(jìn)行了前期考察,其中部分市場的法律法規(guī)已允許部署更高階的智能駕駛功能,例如高速NGP等。

預(yù)計(jì)明年將在歐洲率先實(shí)現(xiàn)相關(guān)功能的落地。同時,公司也在持續(xù)跟進(jìn)香港及東南亞市場的政策進(jìn)展。需要強(qiáng)調(diào)的是,海外XNGP的落地不僅取決于技術(shù)成熟度,也與各地的法律法規(guī)密切相關(guān),小鵬正在與當(dāng)?shù)卣氨O(jiān)管機(jī)構(gòu)保持溝通,以推動技術(shù)合規(guī)化應(yīng)用。

Q:奧地利麥格納工廠的生產(chǎn)情況,明年預(yù)期或者計(jì)劃的年產(chǎn)量?未來,是否會去海外更多地方設(shè)廠?

顧宏地:今年8月份,奧地利工廠正式開始投產(chǎn),今年的產(chǎn)能規(guī)模大概是幾千到大幾千輛,明年我覺得是幾萬輛的規(guī)模。

在其他地方建設(shè)本地化工廠,我覺得是絕對需要的。一個希望達(dá)到全球領(lǐng)先的企業(yè),沒有一家是只靠出口能達(dá)到的,一定要有當(dāng)?shù)氐牟季帧a(chǎn)、研發(fā)、銷售服務(wù)、品牌建設(shè),這些都是我們必須要做的。所以我認(rèn)為將來在主要的銷售地區(qū),我們都會有本地化生產(chǎn)和本地化運(yùn)營的能力。

Q:物理AI有哪些難點(diǎn)?

劉先明: 難點(diǎn)在于模型的做法。模型是通過語言建模做離散化token(字符單位),然后經(jīng)過一個架構(gòu),最終輸出。

Q:這套技術(shù)背后的核心原理是什么?

劉先明: 就是把大模型、大算力、大數(shù)據(jù)堆到一塊,模型邏輯非常簡單,背后的原理也很簡單,沒有什么復(fù)雜的故事。但想把它做好難度很大,非常大的數(shù)據(jù)要一口氣讀進(jìn)來,還要在千卡、萬卡級別訓(xùn)練得非常穩(wěn)定保證不崩掉。

Q:無數(shù)據(jù)標(biāo)注具體能帶來什么商業(yè)優(yōu)勢?

劉先明: 舉個例子,我要去歐洲等海外市場、去一個新的地方落地當(dāng)?shù)氐腞obotaxi,其實(shí)不需要數(shù)據(jù)標(biāo)注,只要這個地方有小鵬的車可以采集數(shù)據(jù),就可以把這件事搞定。不需要再定向采集很多數(shù)據(jù),不需要雇很多人去標(biāo)注數(shù)據(jù),成本會下降很多。

Q:小鵬的數(shù)據(jù)為什么可以做到無需標(biāo)注?你們是如何通過infra采集到大量長尾數(shù)據(jù)的?

劉先明: 我們最大的優(yōu)勢就在數(shù)據(jù)。采集長尾數(shù)據(jù)有兩個方面:一是車端的infra,我們做了很重要的工作——識別哪些數(shù)據(jù)是要的,哪些是不要的。一輛車平均每天開1.7個小時,能遇到很多好駕駛場景和極限場景,只要有辦法識別出來就可以。二是云端有比較大的數(shù)據(jù)閉環(huán),也在調(diào)優(yōu)數(shù)據(jù)質(zhì)量、分布,避免同一場景下太多重復(fù)數(shù)據(jù)。

Q:你們?nèi)绾沃匦滤伎甲詣玉{駛的本質(zhì)?

劉先明: 我們退回去想,自動駕駛本質(zhì)上它是一個物理AI的問題,你要嘗試去理解這個世界,為它做三維建模,然后推演什么事情要發(fā)生、做預(yù)測,再根據(jù)這些做出最安全、最符合人類意識的一種選擇。這就是物理AI的本質(zhì)。

自動駕駛本身就是物理AI或Robotaxi里面最簡單的一種問題,它只有兩個自由度:向前的加速度以及方向盤的轉(zhuǎn)角,相比于正常的機(jī)器人來說自由度小很多,數(shù)據(jù)空間小,數(shù)據(jù)也更容易獲取。所以物理AI的第一件事就是去做自動駕駛。

Q:為什么扔掉語言?

劉先明: 這幾年AI發(fā)展最大的原動力來自于scaling和data scaling,即不停地用更大規(guī)模的數(shù)據(jù)來訓(xùn)練,我們在語言模型看到了非常好的效果。

物理模型也有同樣的問題:如果想要更大規(guī)模地使用數(shù)據(jù),一定要拆掉所有的separation(模塊界限),讓它變成一種自監(jiān)督的模式,不需要人工標(biāo)注。只要有語言存在,就一定涉及到人工的篩選或標(biāo)注,于是我把它拆掉,讓它變成一種非常極致的數(shù)據(jù)驅(qū)動模式。

Q:現(xiàn)有的VLA架構(gòu)存在什么問題?

劉先明: 很多VLA架構(gòu)基本都是圖像進(jìn)來,通過一個大語言模型最終輸出一Meta action(高級抽象的動作指令),Meta action一般是文字,然后再通過文字的方式處理后輸出。這種方式最大的好處是你有很多開源模型可以用,可以直接拿開源的NLP模型來做推理。

但它帶來的問題是,你引入了中間一個離散化的語言輸出,成為了瓶頸,這樣會讓數(shù)據(jù)使用的規(guī)模受到限制。一個系統(tǒng)沒有任何中間瓶頸,才可能大規(guī)模地做起來。

Q:物理世界交互的本質(zhì)是什么?

劉先明: 物理世界交互的本質(zhì)其實(shí)是直接輸出控制信號。為什么這種基于端到端的視頻輸入、動作輸出的大模型能工作?因?yàn)楫?dāng)人類做任何動作時,需要經(jīng)歷幾個過程:先要理解這個場景的3D是怎么構(gòu)建的,然后根據(jù)過去的歷史信息做出對未來的判斷,最后根據(jù)自己的指令做出最終行動。

如果我最終的輸出信號直接是行為的話,那它其實(shí)包含了重建、理解、生成和最后推進(jìn)的所有過程。只要用更大規(guī)模的數(shù)據(jù)、更大的模型把這個事做下來,理論上就可以解決這個問題。

Q:從模型到量產(chǎn),部署方面面臨什么挑戰(zhàn)?

劉先明:這只是一個demo、一個模型。從模型到最終量產(chǎn)涉及部署問題。除了傳統(tǒng)剪枝量化方法外,更重要的是要把它放在端上、放在芯片上,所以需要低延時、高幀率、本地化的部署方案。我們做了從模型到軟件到編譯器到硬件的聯(lián)合優(yōu)化和協(xié)同設(shè)計(jì)。

Q:你們選擇的是世界模型還是VLA路徑?

劉先明:一直有人拿這事問我們選的是哪條路徑。其實(shí)本質(zhì)上這兩個沒什么太多區(qū)別,都是一種極致的端到端系統(tǒng)。我們更多還是要回歸基礎(chǔ)本質(zhì),去解決基礎(chǔ)本身的問題。

Q:"涌現(xiàn)"這個概念在機(jī)器人領(lǐng)域怎么體現(xiàn)?

米良川:古語講"量變引起質(zhì)變"。我們?nèi)ツ臧l(fā)布之后,采用了最艱難的生成式方式去做控制器。從去年10月份一直到今年3月份都在迭代優(yōu)化。在這個過程中整個團(tuán)隊(duì)包括我自己都經(jīng)常,持續(xù)優(yōu)化數(shù)據(jù)、優(yōu)化各種東西,但總看不到質(zhì)變。3月26號那天晚上,團(tuán)隊(duì)測試倒著走的時候,在監(jiān)控器視頻里看發(fā)現(xiàn)倒著走好像有點(diǎn)意思,那一天就是我們控制器的拐點(diǎn)。

到底哪個優(yōu)化帶來這個變化,說不清楚,堅(jiān)持以后突然的飛躍。

Q:機(jī)器人展示的跳舞和貓步行走,背后是什么技術(shù)?

米良川: 大家看到的貓步行走,用的是我們第三代控制器;剛才大家看到的太極,實(shí)際上是第四代。

Q:能介紹一下控制器的代際演進(jìn)嗎?

米良川: 最開始是model base,大概在2023年左右使用,但實(shí)際上我們在2024年就已經(jīng)把它拋棄了。我們也支持MPCC(模型預(yù)測控制),這是業(yè)界用得比較多的技術(shù)路線。我們第三代選擇了一個比較難的路,就是真人模擬——你們看到的貓步也好,自然行走也好,它的步態(tài)和風(fēng)格實(shí)際上是嵌在控制模型里面的。它邁步子本身不是軌跡跟隨或姿態(tài)跟隨,而是生成式的。比如說貓步的那個姿態(tài),怎么走都是貓步,包括左拐右拐。

Q:你們?yōu)楹芜x擇導(dǎo)覽、導(dǎo)購、接待這類場景作為切入點(diǎn)?

米良川: 我們判斷以機(jī)器人當(dāng)前的能力狀態(tài),在這些場景能夠產(chǎn)生有效的價值。同時在實(shí)際場景中一定會發(fā)現(xiàn)新問題,只有在這種"知行合一"的實(shí)踐過程中,才可能真正促進(jìn)能力提升。當(dāng)能力提升到一定程度,自然就會發(fā)現(xiàn)新的應(yīng)用。

Q:您提到現(xiàn)在的運(yùn)動完全是生成式的,是否可以理解為機(jī)器人自主上下臺,背后已經(jīng)沒有遙控器,已經(jīng)有一個激活的大模型在工作?

米良川: 機(jī)器人現(xiàn)在的控制原理,包括控制器,是整體支持的。人要操作它,基本上還是要告訴它方向和速度,它只需要這兩個東西。

方向和速度可以來自于上層的模型生成,比如我們的導(dǎo)航模型就是方向和它直接對接的。如果是遙控,實(shí)際上就是一個人在搖桿操作;如果是既定的編排軌跡,也是這樣的方式。

Q:機(jī)器人量產(chǎn)時不得不考慮成本問題,這一代相比上一代成本有什么變化?

米良川:成本問題分成兩部分,一部分是我們能做的,一部分是需要依托整個行業(yè)的。

我們機(jī)器人的所有螺絲基本都是自研。這給了我們迭代的效率,也給了我們技術(shù)降本的機(jī)會。但另外一部分,最有效的降本還是等到產(chǎn)業(yè)比較成熟,供應(yīng)鏈能夠共享沉淀下來。

Q:小鵬機(jī)器人與一些機(jī)器人公司有沒有合作關(guān)系?

米良川:我們也在努力希望跟更多同行合作,但當(dāng)前階段還是以自研為主。我們的戰(zhàn)略合作伙伴更多是在一些硬件上,包括一些局部技術(shù)上進(jìn)行合作。雷峰網(wǎng)雷峰網(wǎng)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說