0
本文作者: 張馳 | 2017-10-02 12:40 |
Roadstar.ai原型車的內(nèi)部視角
硅谷的9月28日上午,雷鋒網(wǎng)編輯坐上了一輛頂著7個(gè)激光雷達(dá)的林肯MKZ。它遠(yuǎn)遠(yuǎn)就看到了路口的紅綠燈,車內(nèi)的大平板上對(duì)應(yīng)的交通燈被一個(gè)紅框圈出來(lái)。MKZ繼續(xù)往前開(kāi)了一段,穩(wěn)穩(wěn)地停在了路口。一大群學(xué)生模樣的年輕人從車前的斑馬線走過(guò),并不斷回頭看這臺(tái)頂著裝置的新車。
綠燈亮起,我們乘坐的這輛MKZ起步并按照預(yù)定路線右拐。一路上,道路右側(cè)有遛狗的人、踩著滑板的人,還有逆行的自行車。我們的車按照30英里的時(shí)速在蘋(píng)果的后花園Cupertino行駛了一圈,然后回到了出發(fā)時(shí)的車庫(kù)門口。
你或許已經(jīng)猜到了,這是一輛自動(dòng)駕駛原型車。
這輛車來(lái)自Roadstar.ai,這是一家今年5月成立,橫跨硅谷與深圳兩地的自動(dòng)駕駛公司。公司三位聯(lián)合創(chuàng)始人佟顯喬(CEO)、衡量(CTO)、周光(首席機(jī)器人專家),曾供職于Google、蘋(píng)果、特斯拉、英偉達(dá)、百度等公司,擁有豐富的自動(dòng)駕駛經(jīng)驗(yàn)。
佟顯喬在今年6月接受雷鋒網(wǎng)采訪時(shí)稱,公司的目標(biāo)直指L4級(jí)別自動(dòng)駕駛,希望成為中國(guó)最強(qiáng)戰(zhàn)隊(duì)。在約3個(gè)月后,Roadstar.ai的原型車初步成型。上文就是我們近日體驗(yàn)了原型車后的感受,雷鋒網(wǎng)也是除公司員工外首批體驗(yàn)原型車的外部人士,并在試乘后與三位聯(lián)合創(chuàng)始人聊了聊背后的技術(shù)細(xì)節(jié)。
下面是路測(cè)視頻:
實(shí)現(xiàn)自動(dòng)駕駛有多種技術(shù)路徑,比如以攝像頭為主的方案(特斯拉、AutoX),和以64線激光雷達(dá)為主的方案(Waymo、百度)。Roadstar.ai解決自動(dòng)駕駛技術(shù)瓶頸的方案是多傳感器深度融合。衡量表示,它不以某一種傳感器為主,而是包括了多個(gè)激光雷達(dá)之間的融合,多個(gè)攝像頭之間的融合,以及激光雷達(dá)與攝像頭、毫米波雷達(dá)的融合。
Roadstar.ai原型車上的“車頂盒”
雷鋒網(wǎng)見(jiàn)到那款MKZ原型車上,頂部有一個(gè)被稱為“車頂盒”的方形架子,有車身寬,約30多厘米高。架子上布置了7個(gè)Velodyne的16線激光雷達(dá),三個(gè)攝像頭,以及一個(gè)毫米波雷達(dá)。7個(gè)激光雷達(dá)在同一平面排列成一個(gè)鈍角三角形,最外的兩個(gè)朝車身兩邊傾斜,中間四個(gè)水平放置,頂上的那個(gè)最為奇特,是垂直放置躺著旋轉(zhuǎn)的。
周光表示,最終的方案不會(huì)是這么大的一個(gè)傳感器,而是會(huì)嵌入車體,比如激光雷達(dá)可以安裝在車頂?shù)乃膫€(gè)角?!拔覀冇幸惶谆跈C(jī)器學(xué)習(xí)的實(shí)時(shí)標(biāo)定方法,車輛行駛時(shí)可以做自動(dòng)校準(zhǔn),激光雷達(dá)可以隨便放置?!?/p>
多傳感器融合倒也并不獨(dú)特。從目前已經(jīng)曝光的圖片來(lái)看,通用與Cruise在兩周前宣布推出的全球首款可量產(chǎn)自動(dòng)駕駛車,就是用的這種方案;硅谷知名的自動(dòng)駕駛公司Drive.ai,以及一直保持低調(diào)的Zoox也是如此。曾供職于蘋(píng)果自動(dòng)駕駛部門的佟顯喬告訴雷鋒網(wǎng),蘋(píng)果也是用的多傳感器融合方案。
Cruise的第三代可量產(chǎn)自動(dòng)駕駛車,用了多顆激光雷達(dá)分布式布局
Drive.ai的原型車,車頂有6個(gè)16線Velodyne激光雷達(dá)
蘋(píng)果的新版原型車(也有猜測(cè)為高精地圖采集車),頂上有十多個(gè)激光雷達(dá)
周光稱,這是因?yàn)楦骷乙呀?jīng)逐漸“摸索出了正確的道路”。
他認(rèn)為,自動(dòng)駕駛是一項(xiàng)具有長(zhǎng)尾效應(yīng)的系統(tǒng)工程,由于現(xiàn)實(shí)路況過(guò)于復(fù)雜,以至于99%的精力可能都會(huì)用于解決那1%的問(wèn)題。多傳感器融合就是解決這種長(zhǎng)尾效應(yīng)的方法,畢竟異構(gòu)傳感器則可以互相彌補(bǔ)缺點(diǎn),而如果用同質(zhì)的傳感器,再多也沒(méi)用,因?yàn)槿秉c(diǎn)是一致的。
他還舉了一個(gè)例子,就像人臉識(shí)別早已很普及了,但往往會(huì)受光照和裝扮的影響,但蘋(píng)果Face ID添加了一加了一層深度信息后,就能讓身份驗(yàn)證更安全。多傳感器融合也是同樣的道理。
另一方面,佟顯喬表示,采用多傳感器融合架構(gòu),也是考慮到了自動(dòng)駕駛車輛的商業(yè)化。
對(duì)于目前的L4自動(dòng)駕駛方案而言,激光雷達(dá)高昂的價(jià)格是一個(gè)挑戰(zhàn),甚至在原型車的成本中,它往往要占比超過(guò)50%。他表示,64線的Velodyne激光雷達(dá)單個(gè)價(jià)格達(dá)8萬(wàn)美元,而使用多傳感器融合方案,即使采用6顆16線產(chǎn)品,價(jià)格也只是48000美元(每個(gè)8000美元),便宜了將近一半。如果采用國(guó)產(chǎn)激光雷達(dá),價(jià)格甚至可以再降低至少一半。
另一方面,業(yè)內(nèi)普遍認(rèn)為激光雷達(dá)的未來(lái)趨勢(shì)是固態(tài)激光雷達(dá),據(jù)稱明年初即可開(kāi)始見(jiàn)到單價(jià)2000美元的量產(chǎn)型號(hào)。而固態(tài)產(chǎn)品在2-3年內(nèi)取代機(jī)械旋轉(zhuǎn)式后,單個(gè)價(jià)格還可以降到500-1000美元。
而固態(tài)激光雷達(dá)是非旋轉(zhuǎn)式,只能覆蓋一定范圍的區(qū)域,需要多個(gè)同步才能實(shí)現(xiàn)對(duì)周圍空間的全面覆蓋。所以使用固態(tài)激光雷達(dá)必須使用多傳感器融合方案。
佟顯喬還預(yù)測(cè),使用多傳感器融合方案,并考慮未來(lái)固態(tài)激光雷達(dá)帶來(lái)的成本下降,2018年自動(dòng)駕駛系統(tǒng)的成本會(huì)在50萬(wàn)左右,2019年還會(huì)降到30萬(wàn)以內(nèi),在2020年甚至?xí)档?萬(wàn)以內(nèi),讓技術(shù)更為普及。
雖然多傳感器融合的重要性不言而喻,但衡量認(rèn)為,并非所有人都能做好。
他解釋稱,這是因?yàn)楫悩?gòu)傳感器的原理不一樣,會(huì)導(dǎo)致采樣速率、對(duì)空間的描繪和信息表達(dá)方式也不一樣,而怎么把不同的信息結(jié)合起來(lái)變得一致,做到時(shí)間空間同步,以及信息表達(dá)同步,這非常困難。融合不是傳感器的堆疊,“融合不好,反倒會(huì)成為干擾”。
Roadstar.ai將自己的融合方案稱為“DeepFusion”,這一方面是指用到了深度學(xué)習(xí)等技術(shù),另一方面是指觸達(dá)了更深層次的數(shù)據(jù)信息。
衡量告訴雷鋒網(wǎng),多傳感器融合可分為前融合與后融合。后融合是指每個(gè)傳感器分別生成物體列表,比如用攝像頭的數(shù)據(jù)生成一個(gè)檢測(cè)到的物體列表,同時(shí)用激光雷達(dá)的點(diǎn)云數(shù)據(jù)也產(chǎn)生一個(gè)列表,然后兩者再做融合。他們采用的則是前融合,它會(huì)從原始數(shù)據(jù)的層級(jí)把多種傳感器的數(shù)據(jù)融合。
“我們會(huì)用圖像的RGB數(shù)據(jù)加上激光雷達(dá)與毫米波雷達(dá)的深度信息,先融合成新的數(shù)據(jù)形式,再用算法產(chǎn)生物體列表?!?/p>
衡量表示,從信息論的角度看,前融合對(duì)信息的利用更為充分,信息也沒(méi)有丟失。
他此前曾在斯坦福GPS實(shí)驗(yàn)室做衛(wèi)星導(dǎo)航,而導(dǎo)航領(lǐng)域很早就開(kāi)始做融合,比如將非常可靠但有累積誤差的慣性導(dǎo)航,與易受干擾但無(wú)累積誤差的GPS定位做融合,對(duì)于從原始數(shù)據(jù)的層級(jí)做合并已經(jīng)輕車熟路。
Roadstar.ai今年5月才成立,佟顯喬表示,這個(gè)時(shí)候開(kāi)始做肯定是要有特別的優(yōu)勢(shì),要走新的路線,達(dá)到事半功倍的效果。這條路線就是多傳感器融合,而且“大家都逐漸意識(shí)到這是一個(gè)正確的方向,最終各主要玩家也會(huì)趨同,而我們目前是領(lǐng)先的”。
高精度地圖
雷鋒網(wǎng)體驗(yàn)Roadstar.ai的原型車時(shí)發(fā)現(xiàn),其系統(tǒng)對(duì)紅綠燈的識(shí)別極為準(zhǔn)確,甚至在人眼還未看到時(shí),就已經(jīng)識(shí)別出來(lái)了。衡量解釋稱,這是因?yàn)楦呔鹊貓D對(duì)交通標(biāo)識(shí)的定位很準(zhǔn)確,從而降低了識(shí)別的難度。
在自動(dòng)駕駛時(shí)代,地圖服務(wù)的對(duì)象不再是人,而是機(jī)器,因而也需要重新定義。毫無(wú)疑問(wèn),高精度地圖的第一個(gè)關(guān)鍵字是“精”,既精確且不斷更新的三維數(shù)據(jù)。精度上要做到厘米級(jí),因?yàn)閭鞲衅鞯木纫约跋到y(tǒng)對(duì)物體辨識(shí)和識(shí)別都要厘米級(jí),有了足夠的精度,地圖提供的數(shù)據(jù)才有用。
衡量告訴雷鋒網(wǎng),高精度地圖的第二個(gè)關(guān)鍵,是提供感知與定位所需的特征的有效表示,而這也是他們的優(yōu)勢(shì)所在。
Roadstar.ai的厘米級(jí)精度三維地圖,圖片來(lái)自Roadstar.ai
“傳統(tǒng)地圖與高精度地圖在工具鏈、生產(chǎn)流程不一樣,目的、地圖表達(dá)方式和數(shù)據(jù)來(lái)源也不一樣,Google地圖部門與自動(dòng)駕駛的地圖部門就是分開(kāi)的。前者是一個(gè)大規(guī)模數(shù)據(jù)庫(kù)快速查詢的問(wèn)題,但對(duì)后者來(lái)說(shuō),更關(guān)鍵的是地圖怎么生成,怎么有效表示,怎么盡量減少存儲(chǔ)空間,這是我們的長(zhǎng)處?!?/p>
高精度地圖分為不同的層級(jí),有與駕駛相關(guān)的語(yǔ)義信息層級(jí)(如車道線、停止線和十字路口、交通規(guī)則等信息),還有更高層次的感知與定位的層級(jí),用來(lái)做車輛的感知與定位。
他認(rèn)為,只有做感知與定位算法的自動(dòng)駕駛公司,才更懂得怎么做地圖特征的提取。因?yàn)榘言键c(diǎn)云數(shù)據(jù)存下來(lái)不現(xiàn)實(shí),需要壓縮并減少數(shù)據(jù)量。
對(duì)于高精度地圖,Roadstar.ai還沒(méi)想成為提供商,但可以向其它公司提供地圖生成的算法,幫助加工。
那么在原型車出來(lái)之后,接下來(lái)應(yīng)該做什么?
周光表示,數(shù)據(jù)還是很重要。在發(fā)揮現(xiàn)有技術(shù)和架構(gòu)的優(yōu)勢(shì),達(dá)到不錯(cuò)的效果后,還是要采數(shù)據(jù),擴(kuò)大規(guī)模。他認(rèn)為,有些場(chǎng)景很難出現(xiàn),要大量重復(fù)路測(cè)采集才能覆蓋更多的路況。雖然機(jī)器學(xué)習(xí)的效率會(huì)提高,對(duì)數(shù)據(jù)量的要求也會(huì)降低,但自動(dòng)駕駛會(huì)呈現(xiàn)迭代的過(guò)程,需要通過(guò)運(yùn)營(yíng)來(lái)采集數(shù)據(jù),最終擴(kuò)大到更廣泛和復(fù)雜的場(chǎng)景。
目前,Roadstar.ai已經(jīng)與華夏幸福合作,明年會(huì)在南京溧水區(qū)有小范圍的自動(dòng)駕駛車輛運(yùn)營(yíng)。另外,據(jù)稱關(guān)于自動(dòng)駕駛的商業(yè)化路徑,他們進(jìn)行了調(diào)研,會(huì)在接下來(lái)的1-2個(gè)月內(nèi)披露具體的商業(yè)計(jì)劃。雷鋒網(wǎng)會(huì)保持持續(xù)關(guān)注。
附雷鋒網(wǎng)與Roadstar.ai采訪節(jié)選:
在大公司的經(jīng)歷帶來(lái)了什么影響?
團(tuán)隊(duì)成員之前在蘋(píng)果、英偉達(dá)、Google、特斯拉、百度等任職,是取各家之所長(zhǎng)。各家的思路不同,傳感器和架構(gòu)也很不同。蘋(píng)果用的就是多傳感器融合方案;特斯拉是量產(chǎn)中ADAS最好的,它是車廠的思路,會(huì)從整車的設(shè)計(jì)成本出發(fā),限制自動(dòng)駕駛系統(tǒng)的成本,這決定了它不會(huì)有更貴的傳感器,而是以攝像頭為主;Google算法較為成熟,但過(guò)于依賴激光雷達(dá)且成本昂貴。我們希望做到比Waymo更好的性能,但成本要低。
為什么會(huì)認(rèn)為多傳感器融合方案要優(yōu)于Google/Waymo?
Google通過(guò)近十年的努力,其實(shí)已經(jīng)證明無(wú)人駕駛技術(shù)是能做成功,是可行的,而且基本已經(jīng)可以商用了。但它既有先發(fā)優(yōu)勢(shì),也有先發(fā)劣勢(shì)。
Google把以激光雷達(dá)為主的技術(shù)路線走到了極致,在它最開(kāi)始做自動(dòng)駕駛的那些年,圖像識(shí)別技術(shù)還不夠成熟,只能依靠激光雷達(dá)。但這種時(shí)代特色與背景,讓新方法沒(méi)有在其技術(shù)上體現(xiàn)出來(lái),而這也是新興公司的機(jī)會(huì)。Google自研的激光雷達(dá)性能非常突出,但這一傳感器目前成本降低還有很長(zhǎng)一段時(shí)間。
L4級(jí)別自動(dòng)駕駛的時(shí)間已經(jīng)到了嗎?
其實(shí)Google已經(jīng)證明全自動(dòng)駕駛技術(shù)是可行的,它可以做到平均行駛5000英里才需要人類接管一次,基本已經(jīng)可以商用。但它比較保守,畢竟是第一個(gè)吃螃蟹的。現(xiàn)在從特斯拉Autopilot的情況來(lái)看,即使出現(xiàn)了一些事故,大家也沒(méi)有失去信心。那其實(shí)可以膽子大一點(diǎn),讓自動(dòng)駕駛在一定范圍內(nèi),在限定條件下先運(yùn)營(yíng)起來(lái)。
你們的目標(biāo)是L4,那對(duì)一些更為限定的自動(dòng)駕駛應(yīng)用會(huì)考慮嗎?
特殊場(chǎng)景的自動(dòng)駕駛確實(shí)會(huì)比乘用車率先實(shí)現(xiàn),因?yàn)榍闆r比較簡(jiǎn)單。我們?cè)O(shè)計(jì)的時(shí)候,每個(gè)傳感器和每個(gè)模塊都是抽象的,可以任意替換。我們技術(shù)的一個(gè)子集可以用在簡(jiǎn)單的場(chǎng)景下,不用重新開(kāi)發(fā),比如針對(duì)礦山車,可以降低配置,或用更簡(jiǎn)單的算法,和低成本的計(jì)算平臺(tái)。
一開(kāi)始就做最難的場(chǎng)景,對(duì)于簡(jiǎn)單場(chǎng)景不必重新做。
你們的原型車剛出來(lái)不久,數(shù)據(jù)較少會(huì)是一個(gè)弱點(diǎn)嗎?
深度學(xué)習(xí)確實(shí)是數(shù)據(jù)驅(qū)動(dòng)的算法,但我們的深度融合算法(DeepFusion)提高了數(shù)據(jù)的使用效率,使得我們新的端到端模型對(duì)數(shù)據(jù)的依賴降低了一個(gè)數(shù)量級(jí)。現(xiàn)在的架構(gòu)用幾千張圖可能就可以實(shí)現(xiàn)普通方式十幾萬(wàn)張圖的效果。我們的模型現(xiàn)在是幾千張點(diǎn)云加圖像數(shù)據(jù)融合在一起訓(xùn)練,對(duì)數(shù)據(jù)的利用特別高效。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。