0
本文作者: 思佳 | 2017-08-11 17:23 |
雷鋒網(wǎng)·新智駕按:“這是個尷尬的時刻,不過我們還是來討論技術(shù)吧!”今年3月份在德國柏林召開的博世互聯(lián)大會2017(Bosch Connected World 2017)上,Mobileye CTO兼聯(lián)合創(chuàng)始人Amnon Shashua在演講開場時幽默地如是說。
觀眾笑了。因為就在這場演講開始前的兩天,英特爾宣布斥資153億美元收購Mobileye,也創(chuàng)造了幾乎是2017年最大、最受矚目的收購案。
時間回到現(xiàn)在,就在前幾天,英特爾已經(jīng)正式完成對Mobileye的收購,故事以Mobileye成為英特爾子公司開始一個新的篇章。
很多人都討論過英特爾這筆錢花得值不值,但不可否認的是,Mobileye正調(diào)用自身在環(huán)境“強感知”技術(shù)的積累,在自動駕駛領域走得越來越遠。同時,Mobileye實現(xiàn)了技術(shù)廠商的躍進,如今真正和車企站在一起。
或許是因為這些,或許是因為其他的什么,CTO Amnon Shashua在演講中可以自信地說,“Mobileye正在走一條正確的路線,不這樣做自動駕駛永遠都實現(xiàn)不了?!?/strong>
在這個路線中,人工智能不可或缺。Mobileye到底如何利用人工智能實現(xiàn)對自動駕駛研發(fā)的超車呢?答案在Amnon Shashua的演講中,雷鋒網(wǎng)·新智駕對演講內(nèi)容做了不改變原意的編輯整理。
Amnon Shashua:在浩大的自動駕駛產(chǎn)業(yè)鏈中,人工智能到底扮演著怎樣的角色呢?今天我們要來討論這個問題。
在這之前明確,實現(xiàn)自動駕駛的方案和路徑多種多樣,我將它們分為兩類:比較傳統(tǒng)的方案;大量運用人工智能的方案,也是我們正在做的方案。今天會具體介紹他們。
為了實現(xiàn)自動駕駛,我們需要解決的技術(shù)主要分為三部分:
感知:在車輛部署攝像頭、激光雷達、毫米波雷達等傳感器,配合高性能的算法,讓車輛感知周邊環(huán)境。
高精度地圖:高精度地圖是實現(xiàn)自動駕駛的必要性技術(shù)之一,它提供了一種更前瞻的信息指示和冗余性,是保證自動駕駛安全的基礎。
駕駛決策:在駕駛決策的技術(shù)研發(fā)中,往往能為人工智能提供大量用武之地。其最終目的是,讓自動駕駛車輛在面對復雜交通環(huán)境時,能夠像人一樣駕駛,擁有人類的一些決策屬性和技巧,同時也要保證安全。
下圖是我們與德爾福合作研發(fā)的自動駕駛demo,車輛在長達10公里的拉斯維加斯街道上完成了無干預的自動駕駛。圖中可以看到,3D box準確框出了每一臺車輛,綠色部分標識了可駕駛的空白區(qū)域,同時算法對交通燈、交通指示牌也進行了識別。總的來說,這臺自動駕駛車對周邊環(huán)境進行了360度的感知識別。
再來展示一下關于繪圖的內(nèi)容。下圖展示的是Mobileye近一年半時間研發(fā)的REM(Road Experience Management)路網(wǎng)采集管理系統(tǒng),這是我們通過眾包模式收集數(shù)據(jù)繪制高精度地圖的方法,這些采集到的路標構(gòu)成了RoadBook(路書)。該項目中,我們與寶馬和其他汽車平臺合作,進行數(shù)據(jù)收集。
最終我們得到一個存儲在云端的地圖,它可以投射在兩個界面上,圖中右手邊是將數(shù)據(jù)投射在谷歌地球上,這樣可以得到大尺度的精度參考,左手邊是投射在車輛采集的實時圖像上。
當運行起這樣的系統(tǒng)時,可以看到投射在谷歌地球和車輛視角圖像的車道線非常精準,同時標注出了道路標識等信息,精度達厘米級。
這是另一個demo,與尼桑汽車在倫敦街道上的道路測試。
在這個過程中,人工智能發(fā)揮了哪些作用?
當提到車輛感知,通常指的是物體檢測的過程,即道路上的車輛、行人、交通標識、交通燈等等。
環(huán)境感知的階段一:感知障礙物。對機器而言,輸入的是圖像,輸出的其實是bounding box,如一輛汽車的bounding box、一個行人的bounding box。這是如今的駕駛輔助系統(tǒng),我們需要檢測車輛、行人等物體,再根據(jù)這些障礙物進行相應的駕駛決策。
環(huán)境感知的階段二:感知空閑區(qū)域(free space)。過去的環(huán)境感知,是檢測路緣、護欄等障礙物,依此判斷哪里能夠駕駛,哪里不能。而現(xiàn)在換一種方式,輸入仍然是圖像,但輸出是一種自由形式的邊界范圍(free form boundary)。對邊界范圍進行識別,我們需要對諸如車道線、路緣等等特征進行語義理解,這使得系統(tǒng)實現(xiàn)變得更復雜。
環(huán)境感知的階段三:感知可駕駛區(qū)域(Drivable Paths)。這個階段產(chǎn)生的是真正的顛覆性技術(shù),系統(tǒng)將感知每條道路通往何地,以及與道路相關的語義理解,例如這條路有多長、這條道路會通往高速、高速的出口又在哪里…所以這個時候,輸入是圖像,但輸出的是一個故事,是要去描述一個的場景,而不只是識別出障礙物。我們將這稱為“強感知”,這確實是一個開放性的問題。
以上就是Mobileye在車輛感知中應用人工智能的嘗試。第一階段是單純軟件問題,第二階段進行了升級,目前已經(jīng)實現(xiàn)量產(chǎn),比如特斯拉的第一代Autopilot系統(tǒng),第三階段是非常有挑戰(zhàn)性的,同時需要大量的人工智能技術(shù)參與。
感知技術(shù)是如何被運用的?
感知技術(shù)是如何被運用的?目前主要有兩種路徑,第一種“重地圖模式”(Map heavy approach),第二種“輕地圖模式”(Map light approach),Mobileye屬于第二種方式。
1、重地圖模式
這種方式很好描述,也很容易使用和部署。但這是一個錯誤的方式。為什么?下面具體介紹。
這種方式通過使用3D傳感器(如激光雷達)來檢測車輛和行人,然后被呈現(xiàn)在車輛的3D坐標系統(tǒng)中。
之后,將車輛在3D地圖中進行定位。實現(xiàn)方式有多種,例如車輛通過激光雷達采集了周邊環(huán)境數(shù)據(jù),并與已有的高精度地圖數(shù)據(jù)進行匹配,就可以進行自定位。
將步驟一中檢測到的車輛和行人放置到高精度地圖中,因為你已經(jīng)實現(xiàn)了自定位,而高精度地圖中包含了所有車道線等信息,所以你已經(jīng)擁有了“上帝視角”,你從高精度地圖上獲取了可駕駛的路徑,同時有通過感知得來的物體檢測信息,所以直到目前,似乎我們不需要任何攝像頭。
如果你回憶一下谷歌最初的無人車原型,他們沒有部署環(huán)境感知攝像頭,只有一個看交通燈的攝像頭,其他都是基于激光雷達完成的。
這就是第一種路徑。
2、輕地圖模式
現(xiàn)在,如果你希望系統(tǒng)有更好的魯棒性。你就需要加入更多的傳感器,例如攝像頭。每加入一種傳感器,都需要將其數(shù)據(jù)轉(zhuǎn)化成三維,所以,如果你現(xiàn)在擁有攝像頭數(shù)據(jù),就必須將攝像頭數(shù)據(jù)加載在3D坐標系統(tǒng)中。
問題在于,由2D轉(zhuǎn)向3D是很困難的,毫米波雷達的數(shù)據(jù)也是2D的,它測量不同的維度,但仍然是2D。我們使用輕地圖模式,解決這個問題。
使用攝像頭同時檢測車輛、行人以及可駕駛路徑。即將靜態(tài)和動態(tài)場景描述放在同一個2D坐標系統(tǒng)中。
通過將高精度地圖數(shù)據(jù)投射在車輛獲取的2D圖像中進行車輛自定位。該技術(shù)在上面的demo中已經(jīng)進行了展示。
現(xiàn)在,我們使用這種投射方式,建立一個車輛和可駕駛路徑的統(tǒng)一3D視角,因為地圖是三維的。而當你需要加入一個額外的傳感器,如毫米波雷達、激光雷達等傳感器,你所有需要做的,就是將3D轉(zhuǎn)換成2D。例如將激光雷達數(shù)據(jù)投射到二維圖像中,這是比較簡單的。
舉個例子,這是將激光雷達數(shù)據(jù)和其他數(shù)據(jù)投射到二維圖像上的示例。
這是將毫米波雷達數(shù)據(jù)投射到二維圖像的示例。
現(xiàn)在,讓我們看一下這種方式的優(yōu)勢。如下圖所示,左側(cè)展示了右側(cè)圖像的仰視圖視角,并且我們可以非常準確地獲取這種視角。
所以,攝像頭加地圖就可以提供所有駕駛需要的信息,之后毫米波雷達和激光雷達等傳感器,會處理一些冗余的問題。
接下來,我們總結(jié)一下這兩種路徑的優(yōu)缺點。
重地圖模式的優(yōu)點:
非常容易設計出原型,找10個有才能的工程師,不出6個月的時間,你就能到一個不錯的demo。這就是一些硅谷團隊在做的事。
重地圖模式的缺點:
會造成車輛對高精度地圖的過分依賴,沒有高精度地圖,你什么都做不了。
可駕駛路徑和車輛/行人處于不同坐標系統(tǒng)中,沒有協(xié)同,且每類物體由不同的傳感器識別。當你將它們同步到同一個坐標系統(tǒng)中,容易產(chǎn)生錯誤。
真正重要的是,創(chuàng)建高精度地圖需要人工標注,這是一個巨額的成本投入。
如果沒有一個真正經(jīng)濟的高精度地圖繪制方式,自動駕駛很難真正落地。而如今許多公司在繪制高精度地圖時使用的方式都是非常昂貴的。
輕地圖模式的優(yōu)點:
攝像頭是唯一的環(huán)境感知傳感器,在同一坐標系統(tǒng)中同時檢測車輛/行人以及可駕駛路徑。
使用車載攝像頭傳感器眾包獲取數(shù)據(jù),制作高精度地圖,大大降低了成本。
可實現(xiàn)低成本的level 2+等級自動駕駛。在level 2中,駕駛員需要對車輛駕駛控制負責,但是通過輕地圖模式,可以實現(xiàn)類似level 3、level 4的體驗,同時激光雷達將不是必須的。這開拓了更廣泛的商業(yè)和市場前景。
輕地圖模式的缺點:
非常難以實現(xiàn)。
如剛才所說,感知的第三階段很復雜,且需要大量人工智能技術(shù)輔助。但從長遠角度看,這是一條正確的路徑。重地圖模式短期來看易于實現(xiàn),但長期而言,不能形成規(guī)?;?。
這部分講駕駛決策,即復雜交通中的博弈。上圖中的新聞,是大概一年多前,自動駕駛撞人的案件。無數(shù)自動駕駛車都在面臨一個共性的問題,他們的駕駛決策太過簡單,當一些復雜的、意料不到的事情發(fā)生時,駕駛員必須要進行接管。機器無法做出人類面對復雜情況的博弈和決策。
前提是,駕駛是一個“多主體”的游戲,只要道路上還存在人類駕駛員,那么機器就必須明白人類的決策技巧,人類容易沖動,人類會犯錯,所以自動駕駛車需要與人類司機進行協(xié)同配合,同時要保證安全。
所以,現(xiàn)實生活中的交通到底是什么樣呢?為了弄清楚這個問題,我用一架無人機進行航拍,拍下了一些現(xiàn)實交通的畫面。
上面這輛車嘗試并線,沒人給這個“可憐的人”讓行,不過這就是真實生活!所以想象一下,把這個場景交給自動駕駛車,你如果希望它能做到這樣,那就是天方夜譚了,做到接近都是不可能的。
我們更具體地聊聊。下圖展示了雙車道并線問題,這是我們與寶馬汽車合作的項目,目的是解決現(xiàn)階段一個非常具體的駕駛問題,也是一個非常困難的問題。
在雙車道問題上,車輛會從兩側(cè)車道會車,為什么這個問題具有挑戰(zhàn)性呢?因為車輛不是簡單地擠進來,它可能會干擾其他車輛行駛,也有可能產(chǎn)生兩車僵持的情況。但對于兩車道會車,沒有一個明確規(guī)則,唯一的規(guī)則就是不要發(fā)生事故。
在四車道的十字路口會車時,其實并不是最難的,因為十字路口有交通燈,有規(guī)則,但這種雙車道會車的情況則不同。所以,你必須預估出之后幾秒的情況,并做出規(guī)劃,你需要估摸出會車間距和通行的時間,能夠在不發(fā)生碰撞的情況下及時通過。所以,這其實是一種非常困難的問題。
所以,我們希望能利用機器學習解決這個非常復雜的問題。而機器學習的趨勢,就是數(shù)據(jù)驅(qū)動。
優(yōu)勢:比基于規(guī)則的算法更簡單地觀察和收集數(shù)據(jù)。在很多場景中都是這樣,例如自然語言識別、計算機視覺等等。歷史經(jīng)驗表明,機器理解潛在規(guī)則是很難的,但收集數(shù)據(jù),用數(shù)據(jù)驅(qū)動機器學習算法性能,會獲得更好的表現(xiàn)。
所以,大規(guī)模應用機器學習,是一個正確的趨勢。
缺點:機器學習的性能表現(xiàn)取決于你用來訓練它的數(shù)據(jù),這就意味著有可能出現(xiàn)“臨界”情況。而找到這樣的臨界情況需要更多的數(shù)據(jù),以及更多的嘗試,直到篩選出臨界情況。
所以,機器學習是一個有監(jiān)督的學習過程。在感知過程中,你感知的是當時的場景,而在感知背后的技術(shù),是過去的積累和學習,是深度、有監(jiān)督的學習;而當提到駕駛策略時,你其實是在計劃未來,這是一個不太一樣的機器學習方法,被稱作增強學習,在其中你需要與環(huán)境進行交互。
為什么這兩者在叫法上不同?他們的區(qū)別在于,使用數(shù)據(jù)的方式。
1、有監(jiān)督的學習
在有監(jiān)督的學習中,我們預測的行動不會對環(huán)境產(chǎn)生影響,因此我們可以一次性收集所有的數(shù)據(jù),也可以在線下收集數(shù)據(jù),然后再用這些數(shù)據(jù)不斷訓練神經(jīng)網(wǎng)絡,直到找到所有的“臨界”情況。
2、增強學習
在增強學習中,我們的行動會對環(huán)境產(chǎn)生影響,這意味著,如果我決定左轉(zhuǎn),我就正在影響其他駕駛的車輛。所以,現(xiàn)在如果我要更改軟件,那意味著我需要重新收集所有的數(shù)據(jù),因為每一次變化駕駛決策,就是在改變影響環(huán)境的方式。
這會造成一些問題,因為臨界情況在駕駛中就代表著“事故”的可能性。而事故是一個小概率事件,為了找出這種臨界情況,那么我們就需要大量的數(shù)據(jù),而每次要修改軟件時,又需要重新再收集一次數(shù)據(jù)。這就造成了很大的問題。
這也是為什么傳統(tǒng)基于規(guī)則的路徑規(guī)劃算法沒有引入機器學習,因為這個命題并不是那么吸引人,這聽起來并不是什么好主意。
所以,我們找到了了一種解決這個問題的方式。用這種方法,我們可以使用機器學習算法,同時避免數(shù)據(jù)量的爆炸,并確保安全。在Mobileye網(wǎng)站上可以找到這篇論文。
我們在仿真實驗中對其進行了測試,下圖中的8輛汽車都是被訓練的駕駛主體,隨機分布,可以看到,它們經(jīng)歷了復雜的調(diào)度決策。
在這個仿真實驗中,共經(jīng)歷了10萬次路測駕駛,每次測試中有8個駕駛主體、位置隨機,沒有發(fā)生碰撞事故。系統(tǒng)性能達到每秒10hz的頻率響應。占用的計算量僅1%,而這些,正是得益于人工智能。
在傳統(tǒng)的方法中,你試圖開啟的是一棵包含了所有可能性的樹,這最終會導致數(shù)據(jù)爆炸和系統(tǒng)癱瘓。但如果使用機器學習,就像谷歌Alphago贏得了人類積累了數(shù)千年歷史的圍棋,你正在開啟一種新的可能性。
你使用了一種新的方式,通過數(shù)據(jù)驅(qū)動的方式,穿越了這棵巨大的樹。
目前,Mobileye已經(jīng)在進行相關的研究,如下圖,所有的駕駛主體都是被我們訓練的樣本,可以看到,它們的駕駛行為已經(jīng)越發(fā)接近人類。
總結(jié)一下,Mobileye如何利用人工智能加速自動駕駛的落地?主要是以下幾部分。
1、正確的感知:即通過“強感知”理解可駕駛的路徑。傳統(tǒng)的方法過分依賴高精度地圖,而規(guī)避了技術(shù)上難以實現(xiàn)的部分,但如果這樣做,就不會形成規(guī)?;到y(tǒng)。
2、正確的繪圖:使用“強感知”技術(shù),通過眾包自動生成高精度地圖。我們的技術(shù)最終希望高精度地圖的生成完全自動化。
3、正確的駕駛決策:讓自動駕駛車達到人類等級的判斷力,像人類一樣敏捷,同時還要確保安全,這是一個挑戰(zhàn),我們在這部分的研究仍處于起步階段。大家可以在Mobileye網(wǎng)站上瀏覽我們的研究論文,在這方面我們與寶馬汽車進行了許多項目研究。
而在這部分,如果我們不能正確的解決,那么真的無法使自動駕駛落地。這其中將涉及大量的人工智能技術(shù)。
以上,就是人工智能在自動駕駛領域的創(chuàng)新應用和變革。
點擊獲取Amnon Shashua演講視頻,由雷鋒網(wǎng)·新智駕(AI-Drive)下載上傳。
雷鋒網(wǎng)推薦閱讀:英特爾完成“軍火庫”擴充,還要與Mobileye打造大規(guī)模自動駕駛車隊
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。