丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
智能駕駛 正文
發(fā)私信給張偉
發(fā)送

0

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

本文作者: 張偉 2017-08-31 19:13
導(dǎo)語:端到端自動駕駛系統(tǒng)的那些事兒。

雷鋒網(wǎng)按:雷鋒網(wǎng) · 新智駕(微信公眾號:AI-Drive)持續(xù)關(guān)注和報道智能駕駛領(lǐng)域的一線動態(tài)。從6月份開始,我們聯(lián)合雷鋒網(wǎng) · AI慕課學(xué)院、網(wǎng)易云課堂企業(yè)版舉辦系列智能駕駛講座,邀請業(yè)界、學(xué)界頂尖專家共同打造屬于智能駕駛時代的技術(shù)盛宴。

今年4月,百度推出阿波羅計劃(Apollo),將逐步開放其自動駕駛技術(shù);今年7月,百度在首屆開發(fā)者大會(Baidu Create)上公布了阿波羅計劃的第一批細節(jié),包括百度自動駕駛技術(shù)的架構(gòu)設(shè)計以及一個完整的基于林肯MKZ打造的封閉場地循跡自動駕駛參考設(shè)計——Apollo 1.0。

接下來,這個計劃將逐步開放更多細節(jié),為眾多從事自動駕駛研究的企業(yè)賦能。當(dāng)然,想深入了解這個計劃的人數(shù)不勝數(shù)。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

8月30日晚8點,雷鋒網(wǎng)新智駕邀請到百度智能駕駛事業(yè)部資深架構(gòu)師郁浩詳解阿波羅計劃,進行計劃公布后的首次線上直播。本次分享中,您可以重點關(guān)注的內(nèi)容包括:

  • 端到端(End-to-end)自動駕駛系統(tǒng)的發(fā)展歷史

  • 與傳統(tǒng)的規(guī)則式(rule based)自動駕駛相比,端到端自動駕駛有哪些區(qū)別和優(yōu)劣勢?

  • 百度的阿波羅計劃在這個方向有哪些實踐?

以下內(nèi)容為郁浩分享完整版,由新智駕進行不改變原意的編輯和整理。

兩種方案:Rule based 和 End-to-end

整個阿波羅項目其實是百度面向自動駕駛的一個很宏大的系統(tǒng),而端到端(end-to-end)的方案是其中的一個子方向。今天主要進行這個子方向的實踐和經(jīng)驗分享。

在介紹端到端自動駕駛之前,可以了解一下自動駕駛另一大主流的方案:基于規(guī)則(rule based solution)的方案。這類系統(tǒng)和端到端系統(tǒng)相比還是有很明顯的區(qū)別。

Rule based方案的主體需要人工去搭建,拆解開來一般是以下的流程:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

從車輛開始是一個閉環(huán):從車輛到車上的傳感器(radar、LiDAR以及camera等),綜合在一起獲取信息,這些信息經(jīng)過感知層、經(jīng)過特殊的處理(包括深度學(xué)習(xí)網(wǎng)絡(luò)),最終會提取出道路、行人和車輛等各種信息。在感知到的信息的基礎(chǔ)之上,再加入高精地圖等一些靜態(tài)信息,當(dāng)動態(tài)和靜態(tài)信息結(jié)合在一起后,就會形成一個比較完備的世界模型(Wodel Model)——對外部環(huán)境的完備描述。

在此基礎(chǔ)之上,我們就進入到?jīng)Q策模塊,考慮到駕駛舒適性,這一步主要是演繹推理(reasoning)的一些過程,最終會產(chǎn)生一些決策,決策再往下就到了車廠比較擅長的領(lǐng)域——車輛控制,需要給車輛一些控制信號。

在這樣一個rule based的系統(tǒng)里面,其實有一個非常復(fù)雜的架構(gòu)。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

上圖是國際汽車工程師學(xué)會(SAE)推薦的一個系統(tǒng)架構(gòu)圖。

我們可以看到這樣一個架構(gòu)其實是一個閉環(huán)系統(tǒng),這個閉環(huán)本身又分了好幾個層次。從最底層的控制循環(huán)(Control Layer)往上到安全性能的循環(huán)(Safety Layer)再到本地層的循環(huán)(Local Layer)再到全局的循環(huán)(Global Layer),這樣的層層閉環(huán)做到了對車輛的控制。

這樣一個復(fù)雜的系統(tǒng)其實還是提綱挈領(lǐng)的,再往下分又可以看到這樣一張架構(gòu)圖:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

這張架構(gòu)圖比上一張顯然要詳細得多,但依然還是一種抽象的概括。這張架構(gòu)圖其實也反映出了無人駕駛的幾大問題,需要從業(yè)者聯(lián)手去解決。

一個是系統(tǒng)復(fù)雜性。這樣一個系統(tǒng),需要人工設(shè)計上千個模塊,從0到1是非常艱難的,其系統(tǒng)的復(fù)雜度不亞于一個操作系統(tǒng)

第二個是高精地圖的成本很高。在構(gòu)建世界模型的時候,需要高精地圖的輔助,而高精地圖本身的廣鋪、更新都是極其大的成本。很多創(chuàng)業(yè)公司在往這個方向努力,會嘗試一些眾包的數(shù)據(jù)采集,這一塊也是個很誘人的方向。

還有一個問題是車載硬件計算能力要求非常高。在這樣一個系統(tǒng)里面,有不同的感知、決策模塊,每一個模塊都會使用深度學(xué)習(xí)的優(yōu)化手段。一個綜合的復(fù)雜系統(tǒng)里面,可能需要幾個甚至是十幾個深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),每一個的計算成本都極其巨大。

NVIDIA CEO 黃仁勛曾表示,目前的自動駕駛系統(tǒng),使用2個 Drive PX2核心都不夠,已經(jīng)遠超目前計算能力所能達到的上限,硬件本身就是很高的門檻。

所以,打造一個自動駕駛系統(tǒng)的難度之大,已經(jīng)遠遠超出一家公司的能力范圍,需要一個協(xié)作的生態(tài)(聯(lián)盟)。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

*百度與 NVIDIA 合作推出的自動駕駛系統(tǒng)

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

*百度阿波羅計劃所購建的生態(tài)

這個系統(tǒng)中,有很多公司體量很大,每個公司也只不過做了其中的一部分工作。

剛剛提到一點,人駕駛的時候并不需要這么復(fù)雜的拆解,不需要高精度定位、高精度地圖,只需要一些導(dǎo)航語音的提示。很多人還可以邊打電話邊開車,能一心二用。

與之對應(yīng)的,目前比較熱的一個新興的自動駕駛解決方案就是端到端(end-to-end)的系統(tǒng),它的特點是更接近于人的駕駛習(xí)慣。看到的是人看到的場景,經(jīng)過神經(jīng)網(wǎng)絡(luò)的處理之后,產(chǎn)生類似于人類的駕駛行為。

如圖所示,車輛可能看到的是一張圖片,經(jīng)過加工處理,得到了橫向控制和縱向控制。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

End-to-end系統(tǒng)的發(fā)展歷史

其實end-to-end系統(tǒng)并不是最近這一兩年才出現(xiàn)的技術(shù),這和整個無人駕駛系統(tǒng)一樣,是一個很長遠的事情。

早在1988年的時候,一個名為“ALVINN”的系統(tǒng)就已經(jīng)面世了,是卡耐基梅隆大學(xué)(CMU)的研究成果。當(dāng)時還沒有CNN,用的是比較淺層的全連接網(wǎng)絡(luò),用的是單目相機,只處理30*32的圖像,即便是這么簡單的一個場景,還是可以看到它做了很多傳統(tǒng)的圖像處理的手段(比如二值化)。這樣的一個網(wǎng)絡(luò)也能讓車輛在簡單的道路上行駛。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

到了2005年的時候,Yann LeCun也參與了一個類似的項目,研發(fā)出了DAVE系統(tǒng)。這系統(tǒng)運用了卷積CNN網(wǎng)絡(luò),使用的是雙目相機。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

再到2015年的時候,普林斯頓大學(xué)也做了一些嘗試,用中間狀態(tài)——從原始圖像,不是端到端生成的一個指令,是從中提取一些關(guān)鍵的信息,在關(guān)鍵信息的基礎(chǔ)上,再做自動駕駛的決策和控制。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

轉(zhuǎn)折點出現(xiàn)在2016年,NVIDIA在2005年DAVE的基礎(chǔ)之上,做出了DAVE2。這個系統(tǒng)用的是單目相機、卷積神經(jīng)網(wǎng)絡(luò),更關(guān)鍵的是能搭載上實車路測。NVIDIA還為此研究出了配套的評估體系。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

在NVIDIA之后,我們可以看到眾多的創(chuàng)業(yè)公司如雨后春筍般冒出來。比如Comma.ai、Udacity、Drive.ai以及AutoX,當(dāng)然,后兩家沒有明確提及end-to-end系統(tǒng),比較愿意說他們的系統(tǒng)完全基于深度學(xué)習(xí)、可快速大量的擴展等。Udacity為此還專門組織了end-to-end steering的比賽,其中也包含了很多很出彩的成果。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

其實end-to-end系統(tǒng)不只是針對于自動駕駛領(lǐng)域,其實對于機器人行業(yè)來講,都有比較大的影響,可以說是變革。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

上圖是李飛飛實驗室做的室內(nèi)機器人的行駛測試,完全基于深度神經(jīng)網(wǎng)絡(luò)的端到端的系統(tǒng),里面沒有事先預(yù)置好的地圖,也沒有自定位、SLAM功能,完全是機器人實現(xiàn)的自動行駛。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

還有一些是機械臂的操控,自動化完成一些指定的任務(wù)。傳統(tǒng)的機械臂也需要封閉環(huán)境的準(zhǔn)確信息,以及各個關(guān)節(jié)和組件也需要極高精度的定位。經(jīng)過閉環(huán)的控制,按照預(yù)設(shè)的軌跡執(zhí)行特定的任務(wù)。而end-to-end系統(tǒng)就不需要這些,不再受限于簡單的封閉的環(huán)境,可以走向開放的環(huán)境里去。當(dāng)然,也不再受限于高精地圖、高精的環(huán)境信息。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

當(dāng)然,目前也有一些人在用端到端的系統(tǒng)做一些更為主動的規(guī)劃,而不是一味的被動響應(yīng),這也是很有意思的方向。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

End-to-end 現(xiàn)狀總結(jié)

那么end-to-end系統(tǒng)能干嘛?不能干嘛?主要的問題是什么?與rule based系統(tǒng)有什么區(qū)別和聯(lián)系?

接下來來拆解一下:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

從功能層面看的話,我們把自動駕駛的行為或者功能按照兩個角度來分:一個是Reactive control;一個是Proactive planning。人可以邊打電話邊開車,其實就是Reactive control的一種,有時候是條件反射,甚至是一些簡單的駕駛經(jīng)驗就可以判斷,不用你去做深入的思考。

而與之相對的就是Proactive planning,在一些陌生的環(huán)境、道路,聽導(dǎo)航的指示時,你要想一想該怎么走。比如并線的時候要看一看周圍的環(huán)境怎么樣、盲區(qū)有沒有車、其他車輛的車速如何……

所以從功能角度來看,目前的end-to-end系統(tǒng)實現(xiàn)的是Reactive control,或者說是類似于人潛意識的駕駛行為。而在Proactive planning這一塊,目前end-to-end系統(tǒng)還處在研究階段,這也是一個很誘人的方向。

在系統(tǒng)工程復(fù)雜度上,Rule based系統(tǒng)是極高的,而end-to-end系統(tǒng)則比較低。因為其中需要人工去構(gòu)建的部分大多由神經(jīng)網(wǎng)絡(luò)去擬合了。

當(dāng)然,二者對于算法的要求都很高。

至于“可解釋性”,其實是非常多人在討論的事情,達成的共識是rule based系統(tǒng)可解釋性很高,而end-to-end系統(tǒng)可解釋性很低。

這里,要說明一下“可解釋性”與自動駕駛最終能落地的關(guān)系。其實,我們跳出來看,對于傳統(tǒng)的基于規(guī)則的無人駕駛系統(tǒng),影響其最關(guān)鍵的點恰恰就在于規(guī)則式系統(tǒng)中存在著大量的不確定的邊界性問題,這些問題是“不可解釋的”。從這點看,rule based系統(tǒng)也沒有壓倒性的優(yōu)勢。

此外,可解釋性當(dāng)然很重要,去年9月份,美國白宮發(fā)表的針對自動駕駛行業(yè)的指導(dǎo)意見便指出,涉及到行駛安全的部分一定要具備可解釋性。

再看系統(tǒng)廣鋪的成本,rule based系統(tǒng)成本非常高,因為其依賴于高精度地圖,普通地圖的維護更新都需要很巨大的成本,可想而知高精度地圖的維護和更新成本會有多大。End-to-end系統(tǒng)廣鋪成本則很低了,因為其不依賴地圖和定位。

傳感器成本方面,rule based系統(tǒng)的成本會很高,而end-to-end系統(tǒng)則相對較低。在歐洲的車廠中,自動駕駛系統(tǒng)傳感器非常之多,光攝像頭就有很多個,還有很多radar、LiDAR(4線)。但end-to-end系統(tǒng)本身不是可以去減少使用傳感器,而是在信息利用率上很高,主要是整合信息的能力很強。

另外一個是車載計算能力,無疑這方面rule based系統(tǒng)要求會很高,end-to-end系統(tǒng)這方面要求就要低一些。

最后一個是數(shù)據(jù)成本,包括獲取和標(biāo)注數(shù)據(jù),這是對于自動駕駛發(fā)展來說比較關(guān)鍵的一點。在rule based系統(tǒng)中,因為需要人工去設(shè)計各個模塊,所以需要人工去對數(shù)據(jù)進行標(biāo)注,比如比較知名的KITTI數(shù)據(jù)集,會耗費人力對環(huán)境圖像、LiDAR數(shù)據(jù)進行標(biāo)注。這樣一來,數(shù)據(jù)采集成本已經(jīng)很高了,后期的標(biāo)注成本可能會更高。

而end-to-end系統(tǒng)的數(shù)據(jù)成本則要低很多,一方面其數(shù)據(jù)是傳感器數(shù)據(jù),部署成功后就可以自動化去獲??;另一方面數(shù)據(jù)是人的駕駛行為,也是可以自動化的去采集,這樣的話整個數(shù)據(jù)成本就把標(biāo)注的成本剔除了。整體成本要減掉二分之一甚至更多,因為一旦一些車廠和ADAS公司采納這一系統(tǒng),就可以批量、規(guī)?;厝ゲ杉???梢?,end-to-end系統(tǒng)在這方面優(yōu)勢很大。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

總結(jié)起來,核心問題在于:rule based系統(tǒng)的研發(fā)、廣鋪成本極高;end-to-end系統(tǒng)很缺數(shù)據(jù),不過可以自動化、規(guī)?;@取。所以,二者是互補的關(guān)系,對于一些普通的駕駛行為,使用end-to-end系統(tǒng)就足夠了,而對于一些安全層面的駕駛行為,則愿意去采用rule based系統(tǒng)。

Apollo 實踐:Demo

接下來談?wù)劙⒉_項目的一些實踐經(jīng)驗。

上面的視頻是百度的地圖采集車正在采集數(shù)據(jù)供End-to-end系統(tǒng)進行訓(xùn)練。紅線是原始的司機的行為,綠線是模型預(yù)測出的一些結(jié)果。

目前,這個系統(tǒng)還只能做到Reactive control,從視頻中的一個交叉路口車輛的反應(yīng)來看,紅線要進行邊線,但是綠線的預(yù)測還依然默認車輛要保持車道行駛。當(dāng)然,當(dāng)車輛拐彎之后,預(yù)測模型就知道要怎么走。

而上面這個視頻是百度今年在CES Asia上提供給用戶試乘的自動駕駛實車。已經(jīng)將訓(xùn)練后的End-to-end系統(tǒng)搭載上去,經(jīng)過了海量的數(shù)據(jù)的訓(xùn)練。

為了進行功能展示,車輛只用了一個單目攝像頭,在這樣的場地中可以實現(xiàn)自動駕駛。這里比較關(guān)鍵的點在于,我們故意設(shè)計了兩個比較急的彎,在速度上也可以做到更為人性化,急彎處會減速。

視頻后半段,工作人員將轉(zhuǎn)向的交通標(biāo)志推進了場內(nèi),車輛可以識別出這個交通標(biāo)志,然后進行左拐。這個循跡系統(tǒng)其實有很大差別,因為該系統(tǒng)可以識別交通標(biāo)志。

Apollo 實踐:數(shù)據(jù)

如上文所述,end-to-end系統(tǒng)的關(guān)鍵在于很缺數(shù)據(jù),現(xiàn)在的研究數(shù)據(jù)來源主要有兩方面,一方面是真實數(shù)據(jù)(一些機構(gòu)的開源),一方面是模擬器的數(shù)據(jù)(模擬器軟件)。

可以對比一下二者的一些特性:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

在今年的CVPR上,蘋果的獲獎?wù)撐谋闾岢隽藄imGAN的概念,就是要將模擬器中的場景渲染得和真實場景極其接近,如果這些數(shù)據(jù)可以應(yīng)用于自動駕駛實車上,將會是很大的突破。但是現(xiàn)階段仍然要打一個問號。

真實數(shù)據(jù)從哪里來?百度已經(jīng)和長安、江淮等車廠合作,共同推出地圖采集車。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

這些車輛不只是采集地圖信息,還會采集環(huán)境信息以及駕駛行為,這些數(shù)據(jù)會用于后臺做訓(xùn)練。目前已經(jīng)有數(shù)百輛這樣的車在全國各地行駛。

再來說一下具體的數(shù)據(jù),目前,我們開源出來的數(shù)據(jù)的基本結(jié)構(gòu)是這樣的:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

上圖中的圖片是百度的地圖采集車前向的攝像頭采集到的圖片,第一期會開源10000公里的數(shù)據(jù)(是已采集數(shù)據(jù)中的一小部分),在全世界范圍內(nèi)也是絕無僅有的。

當(dāng)然,我們原始采集到的數(shù)據(jù)是軌跡、坐標(biāo)的信息,是參差、有一些擾動的,我們會經(jīng)過地圖的制作流程和工藝將其處理得更為平滑、逼真。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

有了這些高精度的軌跡之后,就可以做很多工作,比如汽車動力學(xué)方面的執(zhí)行:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

其中,百度阿波羅計劃開源的10000公里數(shù)據(jù)大概是這樣的一個組成關(guān)系:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

其中Ctx指的是道路的曲率,為什么會有這么多組曲率數(shù)據(jù),主要還是因為數(shù)據(jù)的延遲,車輛行駛過程中需要進行一定的預(yù)測,而系統(tǒng)無法做到百分之百的實時。

要特別提醒的是,各位在拿到開源數(shù)據(jù)的時候,也要做相應(yīng)的處理。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

Apollo 實踐:模型

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

NVIDIA在2016年就給出了一個基本的橫向的控制模型,一個比較典型的CNN網(wǎng)絡(luò)。除了和CNN的一些基本優(yōu)化套路一樣,這個模型還會有一些問題:

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

而在縱向模型上,百度去年使用的是Convolutional-LSTM的視頻分析方法。 

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

今年,百度采用的是橫向和縱向模型結(jié)合的方式,主要是LRCN的架構(gòu),就是CNN+RNN的整合。CNN去提取每一幀的特征,然后用LSTM擬合出其在時序上的行為。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

開放性的問題

其實走到現(xiàn)在,end-to-end系統(tǒng)還有很多可供討論的開放性問題,需要去優(yōu)化,需要從業(yè)者聯(lián)手去解決。

“阿波羅計劃”線上首講:基于深度學(xué)習(xí)的端到端自動駕駛解決方案

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

記者

文章千古事,得失寸心知。期待一個好故事,目標(biāo)一篇好文章。歡迎來聊:wechat(ZHANGVAE111)。
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說