0
本文作者: 張夢華 | 2017-07-10 07:31 | 專題:GAIR 2017 |
百度是國內(nèi)智能駕駛研究和實(shí)踐的排頭兵,這幾乎沒有爭議。
從 2013 年的北京深度學(xué)習(xí)研究院開始,百度在智能駕駛方面的投入不斷加碼。而半年來,陸奇的進(jìn)入也讓百度在可盡快商業(yè)化的 L3 和追求完整技術(shù)和體驗(yàn)的 L4 之間的選擇逐漸明朗化。
剛剛結(jié)束的百度 AI 大會上,Apollo 平臺的開放成為業(yè)界震動的大新聞。Apollo 為何開放?它開放了哪些能力?能為從業(yè)者們帶來什么?
7 月 9 日,在中國計(jì)算機(jī)學(xué)會(CCF)主辦、雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的 CCF-GAIR 大會智能駕駛專場,百度自動駕駛事業(yè)部副總監(jiān)孫勇義現(xiàn)場做了《Apollo:開放的自動駕駛之路 》主題演講,對以上問題一一作了解釋。以下為演講全文,雷鋒網(wǎng)做了不改變原意的調(diào)整:
我們是今年 4 月份對外公布的 Apollo 計(jì)劃,然后在 7 月 5 號正式發(fā)布了 Apollo 第一版。所謂 Apollo 計(jì)劃就是把百度過去積累的自動駕駛相關(guān)的代碼和能力都開放出來,促進(jìn)整個(gè)生態(tài)的繁榮。
我們對外提出了 Apollo 宣言,即“開放能力,共享資源,加速創(chuàng)新,持續(xù)共贏”。這四個(gè)詞怎么解讀?我簡單來解釋一下:
開放能力
開放自己的代碼和云端服務(wù)能力。現(xiàn)在我們的代碼已經(jīng)開放出來,大家訪問我們的網(wǎng)站就可以獲得。
共享資源
我們會把跟自動駕駛相關(guān)的技術(shù),例如云端的仿真,OTA 中心和數(shù)據(jù)平臺,跟大家共享。
加速創(chuàng)新
Apollo 開放的目的是加速創(chuàng)新,促進(jìn)自動駕駛行業(yè)的發(fā)展和整個(gè)生態(tài)圈的繁榮。
持續(xù)共贏
我們的最終目標(biāo)是幫助生態(tài)合作伙伴,生態(tài)合作伙伴用我們的代碼成功裝一輛車,比我們自己做成功更讓我們高興。
在 Apollo 的宣傳片中,我們提到了仿真平臺、開放開源等,這些我稍后會逐一介紹。
這是 Apollo 的開放路線圖,7 月 5 號我們已經(jīng)完成了開放。開放內(nèi)容分為兩部分,一個(gè)是能力開放,一個(gè)是資源共享。
能力開放
我們 7 月份發(fā)布的是封閉場景自動駕駛功能,到 9 月份,會開放固定車道自動跟車駕駛功能。12月,我們會開放簡單城市道路自動駕駛功能,在后面還會持續(xù)做能力開放,一直到 2020 年,會完整開放高速和普通城市道路的自動駕駛功能。
7月份我們對外開源的模塊主要包括控制、定位、操作系統(tǒng)部分以及運(yùn)營框架。9 月份將要開放的固定車道自動駕駛功能,會包括 planning 和障礙物的檢測。到 12 月份,基本上所有的全套模塊都會開放出來。
資源共享
7 月份我們對外發(fā)布了數(shù)據(jù)平臺 1.0,大家可以從 Apollo 官網(wǎng)上申請我們的數(shù)據(jù)。在這個(gè)數(shù)據(jù)平臺上,我們現(xiàn)在開放了 3D 障礙物標(biāo)注數(shù)據(jù)和 2D 紅綠燈標(biāo)注數(shù)據(jù)。9 月份的能力開放里會有一個(gè)仿真平臺,我們會基于它來開放自己的自動駕駛場景數(shù)據(jù),到 12 月份,則會開放數(shù)據(jù)平臺 2.0,它能夠支持合作伙伴上傳數(shù)據(jù),并做出數(shù)據(jù)處理。
這是 Apollo1.0 的循跡自動駕駛開放模塊,這個(gè)模塊分四層,最下面一層是車輛平臺。百度并不制造車,在硬件方面涉足也比較少,這個(gè)車輛平臺指的是我們會有一個(gè)自動駕駛線控車標(biāo)準(zhǔn),像什么樣的車能夠改造成自動駕駛車,比如轉(zhuǎn)彎、控制精度等。
再上一層是硬件平臺,百度基本上是用第三方的硬件。我們會有一個(gè)硬件推薦列表,包括計(jì)算硬件、定位硬件,以及 HMI 硬件。
再上面兩層其實(shí)是百度開源和開放能力的部分。上面一層是軟件平臺,在 Apollo1.0 里面我們對外開放的是系統(tǒng),實(shí)時(shí)運(yùn)行框架,以及定位、控制和人機(jī)交互這幾個(gè)部分;云端平臺這次開放的是 DuerOS,它是一個(gè)語音控制系統(tǒng)。
Apollo1.0 主要包括四個(gè)方面:第一,高效易擴(kuò)展框架;第二,立即可用硬件;第三,一鍵啟動更新;第四,完備開發(fā)工具。
高效的擴(kuò)展框架
我們有非常方便的代碼來使用,復(fù)用,擴(kuò)展,然后使用共享內(nèi)存,保證消息實(shí)時(shí)傳輸。然后實(shí)現(xiàn)了去除單點(diǎn)。因?yàn)槲覀儧]有中心系統(tǒng),去掉任何一個(gè)節(jié)點(diǎn)都不會對整個(gè)系統(tǒng)造成災(zāi)難性影響。并且,平臺提供了完善的使用說明文檔,可以幫助開發(fā)者快速上手。
立即可用硬件
這是 Apollo1.0 參考的車輛和硬件。宣傳片里的兩輛車是林肯 MKZ,我們在 Apollo1.0 里用的就是這輛混動車。計(jì)算節(jié)點(diǎn)用的是工控機(jī),定位用的是 NovAtel 的組合慣導(dǎo),同時(shí),我們也對外發(fā)布了百度自己研發(fā)的 BCU,它能實(shí)現(xiàn)精度非常高的車輛定位。
一鍵啟動更新
為了方便開發(fā)者快速開發(fā)和在車上使用,我們還提供了一個(gè)完整的鏡像,能夠在車上快速安裝。同時(shí),我們還提供了友好的人機(jī)交互界面,可以實(shí)現(xiàn)一鍵啟動運(yùn)行。在運(yùn)行過程中,可以切換到自動駕駛模式,查看車輛行駛軌跡和行駛狀態(tài)。
最后我們還提供了完備的開發(fā)工具以及離線開發(fā)工具,有興趣的可以上網(wǎng)下載,自己試一下。
通過 Apollo,大概多長時(shí)間能組裝好一輛車呢?我們測試過,一個(gè)開發(fā)者只需要三天時(shí)間就能完成一輛 Apollo1.0 車輛的組裝。之前 Apollo 的生態(tài)合作伙伴從美國派了一位工程師過來,在我們團(tuán)隊(duì)的幫助下,三天就完成了整個(gè)車輛的組裝。
今年 12 月份,我們會發(fā)布 Apollo2.0 簡單城市路況自動駕駛功能。圖中(見下圖)紫色部分就是我們在 12 月份要對外開放的模塊。
也基本上到 12 月份,我們的絕大多數(shù)模塊都會開放。硬件平臺會增加攝像頭、毫米波雷達(dá)。并且,我們還會對外發(fā)布一個(gè)汽車安全駕駛相關(guān)的黑匣子,就跟飛機(jī)的黑匣子一樣,記錄當(dāng)前是人駕駛還是車駕駛,當(dāng)前車遇到什么情況,車有什么問題等等。
在軟件平臺,我們會發(fā)布感知模塊(包括 3D 障礙物感知和 2D 紅綠燈感知),車輛規(guī)劃,以及 end-to-end 的學(xué)習(xí)框架,并在云端開放仿真服務(wù)和安全服務(wù)。
仿真能力
現(xiàn)在業(yè)界比較流行的說法是,自動駕駛車輛大概要積累 100 億公里的測試數(shù)據(jù),才能達(dá)到一個(gè)穩(wěn)定可靠的狀態(tài)。如果是 100 輛車在路上 7×24 小時(shí)不停地跑,大概需要幾百年才能積累這么多的駕駛里程,因此光靠車在路上跑是很難實(shí)現(xiàn)自動駕駛要求的,需要有一個(gè)云端平臺來支持。
另外,自動駕駛的能力會不斷提升,按照互聯(lián)網(wǎng)開發(fā)的思維,我們的版本迭代會非???。未來我們每個(gè)新版本都會做云端更新,而每個(gè)新版本都需要有一個(gè)快速驗(yàn)證的能力,我們需要這樣一個(gè)仿真平臺,幫我們積累大量里程,并快速做版本的回歸驗(yàn)證。在仿真平臺上,我們積累了海量的自動駕駛場景數(shù)據(jù),這有可能是最大的中國道路場景數(shù)據(jù)。
Apollo 平臺開放之后,我們希望合作伙伴可以將實(shí)際道路中碰到的各種場景數(shù)據(jù)都上傳到仿真平臺上,和我們共建仿真測試集。這個(gè)仿真測試集越大,我們的自動駕駛車輛能夠驗(yàn)證的自動駕駛場景就越多,通過的場景越多,車就越聰明。這是未來自動駕駛領(lǐng)域的最核心能力。
高精度定位
12 月份,我們還會發(fā)布一個(gè)高精度定位技術(shù)?,F(xiàn)在 Apollo1.0 用的是 RTK+慣導(dǎo)組合定位,這種定位存在一些問題,就是它依賴 GPS 信號,在有高樓大廈遮擋的情況下,比如說在一個(gè) 6 層樓旁邊的 5 米范圍內(nèi),車的信號就會很差。因?yàn)樗趽趿颂焐弦话氲男l(wèi)星信號,定位會產(chǎn)生一兩米的偏差。在隧道或林蔭路場景,也會對 GPS 信號造成遮擋。RTK 定位依賴 3G、4G 網(wǎng)絡(luò),在網(wǎng)絡(luò)不穩(wěn)定的情況下,定位也會發(fā)生較大的偏移。
自動駕駛車上有激光雷達(dá),有攝像頭,完全可以根據(jù)這些傳感器來做輔助定位。
感知模塊
我們會對外發(fā)布基于深度的 3D 感知和紅綠燈識別。紅綠燈識別主要依賴攝像頭,通過攝像頭深度學(xué)習(xí),進(jìn)行感知判斷。
在之后的 Apollo,我們會通過開源+開放,加速整個(gè)行業(yè)的創(chuàng)新,推動技術(shù)發(fā)展。未來,在核心技術(shù)基礎(chǔ)之上,我們會逐步開放自己的能力,共享整個(gè)數(shù)據(jù),也希望合作伙伴能夠給 Apollo 貢獻(xiàn)數(shù)據(jù),為整個(gè)行業(yè)創(chuàng)造用戶價(jià)值和商業(yè)價(jià)值。
Via 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章