0
本文作者: AI研習(xí)社-譯站 | 2018-06-07 10:29 |
雷鋒網(wǎng)按:雷鋒字幕組獲MIT課程團(tuán)隊(duì)授權(quán)翻譯自動(dòng)駕駛課程
我們?yōu)槟阏砹嗣恳粋€(gè) Lecture 的課程筆記,提煉出每一講的要點(diǎn)精華,推薦結(jié)合課程筆記觀看視頻內(nèi)容,學(xué)習(xí)效果更佳。
原標(biāo)題 MIT 6.S094: Deep Learning for Self-Driving Cars 2018 Lecture 2 Notes
作者 | Sanyam Bhutani
翻譯 | tikboa、原野、葉青、聶璐 整理 | 凡江
本文所有圖片均來自課程 PPT。
下文是關(guān)于 MIT 6 S094 第 2 講筆記:自動(dòng)駕駛深度學(xué)習(xí)課程(2018),主講人 Lex Fridman。
自動(dòng)駕駛汽車
(或無人駕駛汽車或 Robocars)
理想觀點(diǎn):
自動(dòng)駕駛汽車如何改變我們的生活:
世界各地一百三十萬人死于交通事故
僅在美國就有 35000 到 40000 人
機(jī)會(huì):設(shè)計(jì)拯救生命的人工智能系統(tǒng)
自動(dòng)駕駛有能力避免司機(jī)醉酒,疲勞,分心駕駛
消滅私有經(jīng)濟(jì):
增加共享流動(dòng)性
節(jié)約開銷
通過減少一個(gè)數(shù)量級(jí)的交通費(fèi)用,降低成本變得可行
在交通工具上嵌入的軟件使我們擁有更個(gè)性化的體驗(yàn)
現(xiàn)實(shí)觀點(diǎn):
增加失業(yè)率:新興科技總是被人們懼怕的,因?yàn)樗赡軙?huì)奪走那些依賴于現(xiàn)有技術(shù)的工作。比如:
從事交通運(yùn)輸?shù)娜藛T。
我們必須在哲學(xué)、技術(shù)、道德層面去考慮智能系統(tǒng)失敗的可能性。
大眾文化中的 AI(不包括工程師)可能懷有偏見?!昂谙蛔印暗牡赖聹?zhǔn)則是什么?它是否是遵循我們的社會(huì)準(zhǔn)則?
安全性:使用代碼的交通工具可能被黑客入侵。
一位工程師的觀點(diǎn):我們想找到一種可行的方法去改變我們的社會(huì),并且改善我們的生活。
懷疑論:
關(guān)于什么是困難的和什么是容易的,我們擁有直覺。然而對(duì)于深度學(xué)習(xí)來說,AI 是有瑕疵的。
人類擅長駕駛。我們的直覺是基于數(shù)據(jù)來源、注釋、算法。
當(dāng)我們作出預(yù)測(cè)和決定時(shí),我們應(yīng)該留意是否朝向了理想主義或者現(xiàn)實(shí)主義。
兩年以上時(shí)間就能開發(fā)出新車的承諾是值得懷疑的。
一個(gè)好的測(cè)試應(yīng)該是在公共道路上大規(guī)模的測(cè)試車輛,另一個(gè)挑戰(zhàn)是怎么讓他們?cè)敢赓徺I。
Rodney Brocks 提出的(被廣泛認(rèn)可的)預(yù)測(cè):
>2032: 美國主要的無人駕駛出租車公司即使在地理禁區(qū)也能隨意實(shí)現(xiàn)接客和下客。
>2045: 美國大部分城市將會(huì)批準(zhǔn)這些。
技術(shù)采用率 VS 年數(shù):
就社會(huì)而言,我們樂于接受新技術(shù)。
每件事都能迅速改變。
概述:
不同的自動(dòng)化方法
自動(dòng)化的等級(jí)(SAE J 3016):
對(duì)初步討論,政策制定和媒體帖子進(jìn)行有用的分類。
對(duì)于設(shè)計(jì)底層系統(tǒng)和整體系統(tǒng)性能來說,沒有什么用處。
超越傳統(tǒng)水平: 兩種類型的AI系統(tǒng)。
起點(diǎn): 每一個(gè)系統(tǒng)在一定程度上都需要人類,需要人們控制車輛并參與到系統(tǒng)中去。
A1: 以人為中心的自動(dòng)化。定義: 人工智能不完全負(fù)責(zé),人類對(duì)行為負(fù)責(zé)。
它可以使用的頻率是多少?
它是基于傳感器的嗎?
交付給司機(jī)接管所需要的秒數(shù),目前接近 0 秒。 (喚醒并控制系統(tǒng)所需要的時(shí)間)
由車外的人員進(jìn)行遠(yuǎn)程接管控制。 人們需要對(duì)以人為中心的自動(dòng)化負(fù)責(zé)。 如果系統(tǒng)失效,人類需要接管控制。
A2: 人工智能完全負(fù)責(zé)。 從法律上講, 汽車設(shè)計(jì)師對(duì)此行為負(fù)責(zé)。
不涉及遠(yuǎn)程操控。
不應(yīng)該有 10 秒原則,這點(diǎn)還不夠好。
必須找到安全港。
允許人類接管作為個(gè)人選擇。 僅當(dāng)遭遇危險(xiǎn)時(shí)(比如車禍),人工智能會(huì)無視人類操控。
L0: 起點(diǎn);
L1,L2,L3: A1: 以人為中心;
L4,L5: A2: 完全自動(dòng)化。
以人為中心的方式: 批評(píng): 當(dāng)人類擁有系統(tǒng)時(shí),他們會(huì)過度信任系統(tǒng)。系統(tǒng)越好,人們會(huì)注意得越少。
公眾對(duì)于自主車輛內(nèi)部所發(fā)生的變化有哪些看法:
工程師的觀點(diǎn):
道路上大量的車輛內(nèi)部都配備了自動(dòng)駕駛儀,這就意味著大量的數(shù)據(jù)。
MIT-AVT 自然駕駛數(shù)據(jù)集
數(shù)據(jù)集包括來自三臺(tái)高清攝像機(jī)的影像
GPS、IMU 收集的所有數(shù)據(jù)
來自 CAN Bus 的數(shù)據(jù)
源自車內(nèi)的數(shù)據(jù), 包括對(duì)話、注意力水平、困倦、情緒狀態(tài)、身體姿勢(shì)、活動(dòng)等等。
5B+框架, 主動(dòng)解說。
高速公路出行數(shù)據(jù):
利用數(shù)據(jù)來理解人的內(nèi)在行為。
利用數(shù)據(jù)來訓(xùn)練理解和控制。
GPS 地圖: 紅色-手動(dòng)駕駛里程。 藍(lán)色-自動(dòng)行駛里程。
33% 的里程為自動(dòng)駕駛(使用自動(dòng)駕駛儀)。
簡(jiǎn)略分類: 區(qū)分使用自動(dòng)駕駛儀和手動(dòng)駕駛兩種情況下人的注意力。 承諾:以人為中心的方式,系統(tǒng)不會(huì)被過度信任。
特斯拉自動(dòng)駕駛(Auto-Pilot):
用途:強(qiáng)烈的(很高比例的速度)
道路類型:大多數(shù)為公路
精神參與:在人類不舒服時(shí),進(jìn)行 8,000 次控制轉(zhuǎn)換。要點(diǎn):有風(fēng)險(xiǎn)存在。
身體參與:兩種情況下注意力保持不變。
要點(diǎn):
要相信系統(tǒng),讓系統(tǒng)暴露其缺陷。知道什么情況下它有效,什么時(shí)候失效。
檢查系統(tǒng)的極限:在具有挑戰(zhàn)性的環(huán)境中。
自動(dòng)駕駛汽車:機(jī)器人的角度
前景廣闊:車輛數(shù)量巨大。
深刻的:將控制權(quán)轉(zhuǎn)移給AI。
私人的:構(gòu)建一種以人機(jī)交互為關(guān)鍵點(diǎn)的關(guān)系。
相比于“感知控制”系統(tǒng),它更像“私人機(jī)器人”。
人類和機(jī)器的缺陷必須是透明的,并且在兩者之間進(jìn)行溝通。
要點(diǎn):90% 的情況下啟用系統(tǒng)。通過揭示缺陷,我們?cè)试S人類在需要的時(shí)候采取控制。
傳感器
可以處理的原始數(shù)據(jù)源。
照相機(jī):視覺系統(tǒng)-RGB,紅外線
雷達(dá):超聲波
激光雷達(dá)
超聲波:
在近距離工作良好。
便宜。
傳感器的尺寸可以很小。
能在惡劣天氣、能見度下工作。
范圍很小。
分辨率低。
無法檢測(cè)速度。
雷達(dá):
在具有一定程度自主性的車輛中廣泛可用。
電子和超聲波變種都很便宜。
在有挑戰(zhàn)性的天氣下表現(xiàn)良好。
低分辨率。
在當(dāng)前最為可靠并且使用范圍廣。
雷達(dá):
具有超聲波的所有優(yōu)點(diǎn),并且能夠檢測(cè)速度。
低分辨率。
沒有紋理和彩色分辨率。
激光雷達(dá):
價(jià)格昂貴。
極其精確的信息深度——具有很高的分辨率。
360 度的可見范圍。
可靠的數(shù)據(jù)密度更高。
激光雷達(dá)圖:藍(lán)色的半徑越大,性能越好。
范圍還可以,但不是很好。
在黑暗和明亮的照明條件下可以工作。
在惡劣天氣下無效。
沒有顏色、紋理的信息。
能夠檢測(cè)速度。
傳感器尺寸大。
價(jià)格昂貴。
不適用于超聲波。
照相機(jī):
便宜。
高分辨率:信息密度最高,信息能夠被學(xué)習(xí)和推斷。
與其他傳感器相比,可獲得更多數(shù)量級(jí)的數(shù)據(jù)。
人類大體上用類似的方式工作。
缺點(diǎn):深度估計(jì)不好,在極端天氣下不可靠。
范圍和靈敏度的對(duì)比。條件 1:清晰,光線好的條件
照相機(jī)提供最大的范圍。
超聲波有較高的分辨率,但是提供的范圍很小。
條件 2: 清晰、昏暗條件 VS 條件 3:大雨或霧或雪:
在兩種條件下視覺上都不可靠。
雷達(dá)能保持不變。
激光雷達(dá)在夜間運(yùn)轉(zhuǎn)良好,但在惡劣天氣條件下無法工作。
照相機(jī):
便宜。
傳感器尺寸小。
近距離時(shí)性能較差。
范圍最大。
在強(qiáng)光下表現(xiàn)良好,對(duì)光線條件較為敏感(但也不總是如此)。
在黑暗條件下無法工作。
在能見度較差(惡劣天氣)時(shí)無法工作。
提供了豐富的文本信息(深度學(xué)習(xí)所必須的)。
傳感器融合:
便宜的傳感器:超聲波+照相機(jī)+雷達(dá)。
傳感器的未來
照相機(jī)和激光雷達(dá)對(duì)比
激光雷達(dá)
融合的便宜傳感器:標(biāo)記的數(shù)據(jù)一直在增長,深度學(xué)習(xí)算法在持續(xù)改善中。
兩者表現(xiàn)一樣好。對(duì)激光雷達(dá)的挑戰(zhàn)體現(xiàn)在:花銷、范圍和尺寸。
便宜傳感器融合和激光雷達(dá)的對(duì)比
公司
Waymo 公司
2017年4月:結(jié)束測(cè)試,允許第一次公開上路。
2017年11月:獨(dú)立(筆記:獨(dú)立的定義存在爭(zhēng)議)駕駛了超過400萬英里。
2017年12月: 沒有司機(jī)。
優(yōu)步
2017年12月:自動(dòng)駕駛超過了200萬英里。
特斯拉
2014 年 9 月:發(fā)布了名為 Autopilot 的自動(dòng)駕駛系統(tǒng)。
2016 年 10 月:從頭開始研制第二代 Autopilot 系統(tǒng)。
2018 年 1 月:通過自動(dòng)駕駛系統(tǒng) Autopilot 行駛了超過 10 億英里。
2018 年 1 月:超過 30 萬輛汽車裝備了自動(dòng)駕駛系統(tǒng) Autopilot。
奧迪 A8 系統(tǒng)(將于 2018 年底發(fā)布):
承諾達(dá)到 Level 3 級(jí)別的自動(dòng)駕駛技術(shù)。
Thorsten Leonhardt 將 L3 定義為: 如果遇到交通擁堵,汽車將以低于每小時(shí) 60 km 的速度行駛。
發(fā)生碰撞后汽車將負(fù)有法律責(zé)任(在自動(dòng)駕駛模式下)。
值得注意的地方。
人工智能和機(jī)器學(xué)習(xí)的機(jī)遇。
定位和地圖構(gòu)建:
能夠在空間中定位自己。
視覺里程計(jì):
使用照相機(jī)傳感器來理解環(huán)境并定位車輛。
SLAM:同時(shí)實(shí)現(xiàn)定位和地圖構(gòu)建。
在場(chǎng)景中檢測(cè)特征,時(shí)不時(shí)地或者逐幀來追蹤這些特征,估計(jì)照相機(jī)的位置和方向。
傳統(tǒng)方法:
得到傳感器的饋電。
(立體聲) 不失真,矯正
(立體聲) 計(jì)算視差圖
特征檢測(cè) (例如,SIFT 尺度不變特征轉(zhuǎn)換,F(xiàn)AST)特征追蹤 (例如,KLT(Kanade-Lucas-Tomasi)跟蹤算法、軌跡預(yù)估
使用場(chǎng)景部分(要求外部和內(nèi)部檢測(cè))
對(duì)于單聲道,需要更多類似于照相機(jī)方位和距地高度的信息
深度學(xué)習(xí)的方法-端到端的方法:
從視頻中提取特征,使用卷積神經(jīng)網(wǎng)絡(luò)算法。
使用循環(huán)神經(jīng)網(wǎng)絡(luò)來一直追蹤軌跡。
估量姿態(tài)。
贊成:借助數(shù)據(jù)后將變得更好。
贊成:這是“可訓(xùn)練的”
場(chǎng)景理解
借助照相機(jī)來理解環(huán)境。
將照相機(jī)作為主要的傳感器來駕駛。
物體檢測(cè):傳統(tǒng)的 HAAR 算法。
深度學(xué)習(xí)在該領(lǐng)域占據(jù)主導(dǎo)地位,對(duì)識(shí)別、分類和檢測(cè)提供更高的準(zhǔn)確性。
道路紋理和聲音條件:使用遞歸神經(jīng)網(wǎng)絡(luò)算法。贊成:改善車輛的牽引力控制。
運(yùn)動(dòng)規(guī)劃
在理解場(chǎng)景之后,如何從 A 到 B ?
傳統(tǒng):基于控制的優(yōu)化:決定最優(yōu)的控制,將問題形式化為可修正的基于優(yōu)化的方法。
深度強(qiáng)化學(xué)習(xí)方法。
駕駛狀態(tài)
檢測(cè)駕駛的狀態(tài)。
與司機(jī)進(jìn)行交互。
這些度量標(biāo)準(zhǔn)對(duì)于檢測(cè)睡意,情緒狀態(tài),檢測(cè)一覽(確定司機(jī)的注意力在哪里)是非常重要的。
”蜥蜴-貓頭鷹效應(yīng)“:蜥蜴(大部分)的眼睛比頭動(dòng)得更多,而貓頭鷹(小部分)頭比眼睛動(dòng)得更多。
估計(jì)司機(jī)的認(rèn)知負(fù)荷。
身體姿態(tài)估計(jì)。
基于語音交互的司機(jī)情緒。
認(rèn)知負(fù)荷:通過眼睛區(qū)域來估計(jì),通過眨眼動(dòng)態(tài)來估計(jì)一個(gè)人的思維深度,級(jí)別在 0-2 之間。
重申:自動(dòng)駕駛未來的兩條路
論點(diǎn): A1 系統(tǒng)在近些年更受歡迎
對(duì)于 A2 系統(tǒng)的挑戰(zhàn):
復(fù)雜的情況。
聲稱自己處于“繁忙的區(qū)域”。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。