0
本文作者: 張夢(mèng)華 | 2018-05-16 13:15 |
有肖健雄的地方,就有關(guān)于攝像頭方案的討論。
在自動(dòng)駕駛行業(yè),肖健雄的名字幾乎已經(jīng)與攝像頭方案綁在了一起。以往的報(bào)道中,我們看到最多的是這位 CV 界權(quán)威對(duì)攝像頭方案一貫的篤定和推崇,也因此,在激光雷達(dá)代表著“技術(shù)正確”的自動(dòng)駕駛領(lǐng)域,人們對(duì)于從實(shí)驗(yàn)室走出來(lái)的研究者究竟能不能順利完成商業(yè)化轉(zhuǎn)身,總是懷著一連串問(wèn)號(hào),雖然我們知道,這位被稱為 X 教授的學(xué)術(shù)大牛是三維點(diǎn)云深度學(xué)習(xí)的開(kāi)創(chuàng)者,是普林斯頓大學(xué)計(jì)算機(jī)視覺(jué)和機(jī)器人實(shí)驗(yàn)室的創(chuàng)辦人,也是 ECCV 最佳學(xué)生論文獎(jiǎng)和 Google Research Awards 得主。
前情鋪墊是,2016 年 6 月,從普林斯頓大學(xué)助理教授職位離開(kāi)的肖健雄在硅谷創(chuàng)辦了自動(dòng)駕駛公司 AutoX,團(tuán)隊(duì)組建 6 個(gè)月后,就改造出了一輛自動(dòng)駕駛原型車,公司發(fā)布的路測(cè)視頻中,開(kāi)頭便是“USING ONLY CAMERAS”的醒目標(biāo)識(shí),這輛僅搭載 7 個(gè)攝像頭的林肯 MKZ 在 2017 年初完成了 AutoX 的自動(dòng)駕駛首秀。
創(chuàng)業(yè)兩年后,這位在學(xué)生和同行口中獲得無(wú)數(shù)稱贊的 X 教授頻繁用“exciting”來(lái)形容眼下的狀態(tài),“速度”“商業(yè)化”“大眾”“LBS 運(yùn)力”是貫穿整個(gè)訪談的關(guān)鍵詞。你問(wèn)“之前一直堅(jiān)持?jǐn)z像頭路線的 X 教授也使用激光雷達(dá)了,這是在妥協(xié)嗎”,他說(shuō):“沒(méi)有任何變化”;你問(wèn)“商業(yè)化落地的哪個(gè)環(huán)節(jié)最重要”,他說(shuō)“沒(méi)有一個(gè)環(huán)節(jié)不重要”;你問(wèn)“又有哪個(gè)環(huán)節(jié)最困難”,他說(shuō)“每一個(gè)環(huán)節(jié)都困難”......這不是面對(duì)媒體的太極打法,而是如他自己所說(shuō),從大學(xué)教授到創(chuàng)業(yè)公司 CEO,在發(fā)現(xiàn)問(wèn)題、解決問(wèn)題的日常進(jìn)階中,他自己也在發(fā)生著變化。
自動(dòng)駕駛的商業(yè)化起點(diǎn):互聯(lián)網(wǎng)下半場(chǎng)的運(yùn)力之爭(zhēng)
在肖健雄教授的闡述中,自動(dòng)駕駛與互聯(lián)網(wǎng)的用場(chǎng)沒(méi)有本質(zhì)分別,兩者都屬于基礎(chǔ)的生活設(shè)施建設(shè),為各種日常應(yīng)用賦能。互聯(lián)網(wǎng)只有應(yīng)用領(lǐng)域之分,而不具指某家公司,自動(dòng)駕駛也是一樣;互聯(lián)網(wǎng)有電商、外賣(mài)、打車、旅游等垂直化應(yīng)用,自動(dòng)駕駛也會(huì)有園區(qū)車、掃地車、乘用車等不同落地方式。
“互聯(lián)網(wǎng)的競(jìng)爭(zhēng)已經(jīng)進(jìn)入下半場(chǎng),其中,LBS 是近幾年被革命化的新領(lǐng)域。LBS 的上半場(chǎng)是互聯(lián)網(wǎng)算力之爭(zhēng),但效率已經(jīng)提升到極限,下半場(chǎng)其實(shí)就是運(yùn)力之爭(zhēng),誰(shuí)的運(yùn)力強(qiáng),誰(shuí)就占領(lǐng)市場(chǎng)?!?/p>
“運(yùn)力的主要問(wèn)題是'運(yùn)力池'不足,限制了業(yè)務(wù)發(fā)展?,F(xiàn)在的外賣(mài)或打車業(yè)務(wù)量其實(shí)可以進(jìn)一步增長(zhǎng),只是沒(méi)有足夠多的人去送、去開(kāi)車,導(dǎo)致價(jià)格太貴。如果'運(yùn)力池'更大,整個(gè)服務(wù)會(huì)更好,大家的用量會(huì)更上一個(gè)臺(tái)階?!边@是肖健雄的基本判斷。
所以,今天我們所看到的出行和運(yùn)輸瓶頸并非需求的飽和,而是運(yùn)力的匱乏,并非平臺(tái)的獨(dú)大,而是成本的可壓縮空間已接近極限。
“所謂自動(dòng)駕駛其實(shí)不是來(lái)代替人類工作,而是讓這個(gè)'運(yùn)力池'增大?!边@是 AutoX 的商業(yè)主線,肖健雄將其闡釋為“平民化自動(dòng)駕駛”,即讓自動(dòng)駕駛連接城市衣食住行等日常需求。
三條落地路線
根據(jù)這些,AutoX 給出了基于三款無(wú)人駕駛車的 LBS 解決方案:同城低速物流配送車,同城全速物流配送車,和同城 L4 自動(dòng)駕駛乘用車。
“我們想快速把 L4 落地。在這個(gè)過(guò)程中,如果做別的也可以,但中間停太多站反而會(huì)減慢速度。”肖健雄就此解釋了其對(duì) L4 而非輔助駕駛或 L3 方案的青睞。
AutoX 的低速配送車類似之前京東、智行者推出的園區(qū)自動(dòng)配送車大小,因?yàn)樗俣容^低,體積較小,安全可控性也相對(duì)更強(qiáng),全速配送車則更像一個(gè)移動(dòng)的蜂巢快遞柜。目前,AutoX 的低速送貨車隊(duì)已經(jīng)在深圳某園區(qū)試運(yùn)營(yíng),到今年年底,車隊(duì)規(guī)模將增加到上百臺(tái),而目前仍在內(nèi)部測(cè)試的全速車(包括送貨車和送人車)到時(shí)也將上線試運(yùn)營(yíng)。
但今天的技術(shù)成熟度是否足以支撐城市道路上 L4 自動(dòng)駕駛技術(shù)的落地,這款自動(dòng)駕駛乘用車又如何進(jìn)行商業(yè)化定義?
肖健雄表示,車輛會(huì)率先以固定路線巴士的形式出現(xiàn),由此道路情況處于可控范圍內(nèi),車輛運(yùn)行難度也會(huì)相對(duì)降低。“L4 的難點(diǎn)就是測(cè)試問(wèn)題,如果搞成滴滴,確實(shí)很難,因?yàn)檎麄€(gè)北京城,任意兩點(diǎn)之間的每條路得測(cè)試很多遍,這樣算起來(lái),路的數(shù)目就很大。固定路徑的話,你一上來(lái)就 50 臺(tái)車來(lái)測(cè),測(cè)一年,我覺(jué)得已經(jīng)測(cè)到比較有信心了,該見(jiàn)到的東西都基本見(jiàn)過(guò)了。”
*左為低速配送車,右為全速配送車
還是攝像頭為主
之前,肖健雄曾在多個(gè)場(chǎng)合強(qiáng)調(diào)攝像頭為主的傳感器方案,這是基于其對(duì)技術(shù)快速落地的商業(yè)化考慮,“夠便宜,用戶才能接受”,也來(lái)自其對(duì)攝像頭功能演進(jìn)的信心——算法的優(yōu)化可幫助彌補(bǔ)攝像頭的現(xiàn)有缺陷。
但這次 AutoX 給出的技術(shù)方案不僅使用了攝像頭,也出現(xiàn)了激光雷達(dá):在低速車型上,車輛兩邊各放一個(gè)廣角攝像頭,前后各放兩個(gè)攝像頭,并配備一個(gè)速騰的 16 線激光雷達(dá),包括車輛在內(nèi)的整體成本在 1 萬(wàn)美元左右(非量產(chǎn));全速車型上,團(tuán)隊(duì)則設(shè)計(jì)了一個(gè)由 8 個(gè)單目攝像頭組成的 360 環(huán)繞組合,并使用了一個(gè) 40 線激光雷達(dá)。
攝像頭組合的想法是初次在自動(dòng)駕駛公司中實(shí)現(xiàn),AutoX 團(tuán)隊(duì)從幾百個(gè)攝像頭中選出了 8 個(gè)單目攝像頭,完成了整體設(shè)計(jì),成本在 300 美元左右(非量產(chǎn)),內(nèi)部的攝像頭分布,日后也可根據(jù)適配車型進(jìn)行調(diào)試。
關(guān)于激光雷達(dá)的作用,目前有兩種主要論點(diǎn),一種認(rèn)為其是車輛感知的必要配置;一種則認(rèn)為激光雷達(dá)僅僅是作為冗余存在,自動(dòng)駕駛車輛運(yùn)行的主要工作依然要靠攝像頭來(lái)完成,如 Mobileye CEO Amnon Shashua 就曾在多個(gè)場(chǎng)合闡述這種主張,顯然,肖健雄也是后種論斷的支持者,所以也堅(jiān)持不會(huì)在現(xiàn)有基礎(chǔ)上使用更多激光雷達(dá)。
“加入激光雷達(dá)首先是為了必要的冗余,但大家的意識(shí)也被谷歌訓(xùn)練了,覺(jué)得頭上有個(gè)頂很重要,要是沒(méi)有,人家反而覺(jué)得不好,就算藏在車身里,他也不敢坐。”一直強(qiáng)調(diào)“要榨干攝像頭性能”的 X 教授并沒(méi)有放棄自己的“初心”,這次訪談中,他也展示了團(tuán)隊(duì)在強(qiáng)化算法的基礎(chǔ)上完成的攝像頭測(cè)試,包括雨天、黑夜、太陽(yáng)直射等多種情境下的優(yōu)秀感知效果,與普通的激光雷達(dá)相比,其對(duì)遠(yuǎn)距離物體的探測(cè)也表現(xiàn)出了明顯優(yōu)勢(shì)。
“其實(shí)現(xiàn)在攝像頭技術(shù)是非常成熟的,而且非常廉價(jià),比方說(shuō)它的動(dòng)態(tài)范圍可以很高,有的甚至超過(guò)人眼。當(dāng)然肯定不能亂選,要選對(duì)的。我們團(tuán)隊(duì)有很多視覺(jué)領(lǐng)域的專家,有多年的行業(yè)經(jīng)驗(yàn),會(huì)選擇最高性能的攝像頭。我覺(jué)得未來(lái)的前景肯定是攝像頭越來(lái)越強(qiáng)。”
當(dāng)然,對(duì)攝像頭的執(zhí)著仍是源于成本優(yōu)化的考慮,肖健雄也表示,攝像頭與激光雷達(dá)并非對(duì)立面,只是各家的算法有差。
在 AutoX 的自動(dòng)駕駛車輛上,還設(shè)置了一個(gè) LED 顯示屏來(lái)告知車輛狀態(tài),與外部車輛、行人交互。而這類交互設(shè)計(jì)也已經(jīng)被越來(lái)越多的公司接受和使用,最近宣布即將落地自動(dòng)駕駛打車服務(wù)的 Drive.ai 也使用了類似的外部設(shè)計(jì)。
正確決定
與從事學(xué)術(shù)研究的漫長(zhǎng)生涯相比,肖健雄創(chuàng)業(yè)僅僅只有兩年時(shí)間,但在他口中不時(shí)發(fā)出的卻是“創(chuàng)業(yè)走了很長(zhǎng)路”的感慨,讓他振奮的是團(tuán)隊(duì)“效率越來(lái)越高,打法越來(lái)越清晰”,而如何更快完成產(chǎn)品化落地,讓用戶接受這項(xiàng)新技術(shù)也是他每天需要重復(fù)思考的第一命題。
快速落地,快速進(jìn)入實(shí)際場(chǎng)景應(yīng)用,快速獲取大量數(shù)據(jù),確保公司和技術(shù)都“不是活在真空里”,他用這幾個(gè)“快速”追趕行業(yè),也催促自己,卻很少顯出疲態(tài)。
“我很興奮,我特別看好這個(gè),我覺(jué)得選中創(chuàng)業(yè)是很正確的決定?!?/p>
以下為雷鋒網(wǎng)與肖健雄教授的部分采訪實(shí)錄,雷鋒網(wǎng)做了不改變?cè)獾木庉嫞?/strong>
雷鋒網(wǎng):現(xiàn)在 AutoX 把重心放在了 L4,但之前您對(duì) L4、L5 的預(yù)期好像還是比較保守的。
肖健雄:現(xiàn)在也還是比較保守的,很多人說(shuō)到 2020 年就有大規(guī)模的自動(dòng)駕駛車了,我覺(jué)得很難達(dá)到,固定路徑落地會(huì)更快,但城市的任意兩點(diǎn),2020 年是達(dá)不到的,我現(xiàn)在還是處于保守的那一幫。
雷鋒網(wǎng):到底是先做 L3 還是 L4,如何看待這兩者的爭(zhēng)議?
肖健雄:L3 其實(shí)基本上就是 L4,做 L3 的基本上要做到 L4 水平,然后把它倒退回來(lái),用在 L3 上。很多業(yè)界的人覺(jué)得 L2、L3 跟 L4 是不可融合的,我覺(jué)得是可以的,而且是必須的。我覺(jué)得 L3 只是面向 L4 的一個(gè)中間步驟,關(guān)鍵是用不用這個(gè)中間步驟,這就要看和具體商業(yè)合作伙伴的碰撞。我們不是說(shuō)完全不做 L3,我們現(xiàn)階段重點(diǎn)是在做 L4,但這個(gè)技術(shù)上我們覺(jué)得是通用的。
好的 L3 一定能基本上達(dá)到 L4,因?yàn)?L3 就是我們說(shuō)的,可能有 10 秒鐘 hand over,這個(gè)要求太高了,你要是開(kāi)在美國(guó)道路上,大概 120 公里每小時(shí),10 秒鐘都可以跑 300 多米,這個(gè)基本上就是 L4,L4 大家一般也就最多看 200 米。除非把 L4 用在 L3 上,要不然 L3 就是個(gè)偽命題。甚至做的好的 L2,比方通用的 Super Cruise,也已經(jīng)用了一些 L4 的技術(shù)了。
雷鋒網(wǎng):自動(dòng)駕駛從技術(shù)成熟,到大范圍落地,這之間的商業(yè)化鴻溝是什么?
肖健雄:我覺(jué)得更多是產(chǎn)品化的問(wèn)題,不是說(shuō)自動(dòng)駕駛做好了,當(dāng)天就產(chǎn)品化了,有很多問(wèn)題需要解決。比方說(shuō),我剛剛說(shuō)了好多硬件設(shè)計(jì),硬件要夠可靠,相機(jī)抖動(dòng)范圍有嚴(yán)格要求,而且 Durability 要很久,所以有大量產(chǎn)品化的問(wèn)題。
第二就是 AI 產(chǎn)品化應(yīng)用問(wèn)題。比如說(shuō)現(xiàn)在自動(dòng)駕駛車停在那里,等用戶來(lái)拿包裹,這時(shí)候發(fā)現(xiàn)擋住別人的路了,后面有人倒車倒不了,怎么辦?以前人家肯定會(huì)喊一句,別擋我,我要走了,那你就開(kāi)走了?,F(xiàn)在車?yán)餂](méi)人,你怎么喊它,喊它也沒(méi)用。所以這其實(shí)有個(gè)產(chǎn)品化的過(guò)程,需要考慮的實(shí)際應(yīng)用問(wèn)題大大超過(guò)了自動(dòng)駕駛技術(shù)本身。
雷鋒網(wǎng):之前您一直堅(jiān)持?jǐn)z像頭方案,現(xiàn)在加上激光雷達(dá)更多是為了說(shuō)服合作方嗎?
肖健雄:主要還是為了安全冗余,但我覺(jué)得也要說(shuō)服合作方、說(shuō)服普通老百姓,讓大家去接受這個(gè)新事物。我們做了很多前融合和后融合算法,也把激光雷達(dá)用在了定位上。
雷鋒網(wǎng):這算是一個(gè)妥協(xié)嗎?
肖健雄:其實(shí)我們一直說(shuō)的都是 Camera First,我覺(jué)得現(xiàn)在沒(méi)有任何變化,我們是強(qiáng)調(diào)攝像頭的潛力有多大,能力有多強(qiáng),比如那些說(shuō)激光雷達(dá)好的自動(dòng)駕駛公司,也不止是用激光雷達(dá),也用了攝像頭,所以我們是說(shuō) Camera First,不是 Camera Only。
大家可能覺(jué)得 Camera Only 更好說(shuō),我們其實(shí)向來(lái)都是 Camera First,我們不排斥其它傳感器,以攝像頭為主,其它傳感器為輔,要不然我們就得裝很多激光雷達(dá),現(xiàn)在我們用一個(gè)就夠了,不用很多很多個(gè),也不用很高分辨率的。
所以這也是我們的一個(gè)考慮,我們就以攝像頭為主,這個(gè)肯定是沒(méi)有變,因?yàn)橹挥谐杀緣虻?,才有商業(yè)價(jià)值,太貴了就沒(méi)辦法落地。
雷鋒網(wǎng):40 線的激光雷達(dá),加上這樣一個(gè)攝像頭組合,您對(duì)它的安全性有足夠信心嗎?
肖健雄:這個(gè)是絕對(duì)有足夠信心的,我覺(jué)得已經(jīng)夠了,這已經(jīng)很貴了。
雷鋒網(wǎng):我們是自己做的高精地圖,為什么沒(méi)有找專門(mén)的圖商來(lái)做?
肖健雄:首先,我們這個(gè)要求蠻高的,很多圖商其實(shí)并沒(méi)有做自動(dòng)駕駛?cè)紫到y(tǒng),他其實(shí)并不知道自動(dòng)駕駛的需求是什么,做出的地圖也不一定是最優(yōu)的。
還有,比如有的采集車用了很多傳感器,那跟我們的傳感器不一樣,采了也沒(méi)什么用。因?yàn)椴煌瑐鞲衅鳎蠹铱赡苓€有一點(diǎn)不一樣,你的相機(jī)跟我的相機(jī)不大一樣,你的激光雷達(dá)跟我的激光雷達(dá)又不大一樣,裝的位置又不大一樣.......這里面有大量技術(shù)難點(diǎn)。我們的好處就是一模一樣的車去采,一模一樣的車來(lái)開(kāi),能達(dá)到定位性能最優(yōu)。
第二,我們公司的一個(gè)特色,就是效率特別高,有什么需求馬上調(diào),馬上改,調(diào)起來(lái)性能達(dá)到最優(yōu)。我回到那一點(diǎn),自動(dòng)駕駛安全要求非常高,就意味著什么環(huán)節(jié)都不能掉鏈子,什么環(huán)節(jié)都得緊密配合,有些東西可做可不做,我們都不做,像芯片已經(jīng)很成熟了,自己發(fā)明芯片也沒(méi)有什么提高,但是像地圖這種,其實(shí)還不是很成熟,我們自己做的好處是能確保它的性能非常好。
第三,還有成本問(wèn)題,很多圖商的制圖成本大大超過(guò)了我們的成本,我們?cè)O(shè)計(jì)了非常廉價(jià)的制圖方式。
雷鋒網(wǎng):我們未來(lái)的商業(yè)模式是如何設(shè)定的?
肖健雄:收費(fèi)模式我們有兩種,一種是長(zhǎng)租,一種是短租。
短租現(xiàn)在很流行,像滴滴這種,Driving As Service,主要是賣(mài)服務(wù),主要是小 B 和 C 端用,但是對(duì)大 B 來(lái)說(shuō),他們可能有更高要求,可能想徹底占有這個(gè)車,這個(gè)更像長(zhǎng)租,我們也需要提供一些服務(wù),例如地圖、維修等。
雷鋒網(wǎng):我們的合作伙伴會(huì)是哪些?誰(shuí)來(lái)運(yùn)營(yíng)車輛?
肖健雄:我們跟快遞、物流、超市、飯店和一切需要運(yùn)力的公司合作,我們其實(shí)就是給這些公司提供里程服務(wù)的運(yùn)力公司。以前是有人駕駛,有兩種運(yùn)營(yíng)模式:物流公司運(yùn)營(yíng),或者第三方車隊(duì)運(yùn)營(yíng)。分界點(diǎn)就是開(kāi)車的人到底是物流公司的員工還是第三方公司的員工,一旦無(wú)人駕駛以后,其實(shí)這個(gè)界限就非常模糊了,不好說(shuō)到底誰(shuí)運(yùn)營(yíng),這個(gè)其實(shí)不好界定。
有一種合作方式,就是車廠給我們提供車,我們裝上我們的東西,再拿去運(yùn)營(yíng),我們是車廠的客戶。
所以,這是一種可能反過(guò)來(lái)的合作模式,不是說(shuō)我們把東西賣(mài)給車廠,再賣(mài)給消費(fèi)者。
雷鋒網(wǎng):現(xiàn)在看起來(lái),我們跟 Tier 1 的接觸反而會(huì)比較少一些。
肖健雄:主要是速度問(wèn)題。我們要走傳統(tǒng)車廠那條路,落地速度比較慢,我們想今年運(yùn)營(yíng)幾百臺(tái),等不了,這樣速度太慢了。一旦技術(shù)成熟,馬上要商業(yè)化,我們現(xiàn)在已經(jīng)到達(dá)那個(gè)點(diǎn)了,已經(jīng)很成熟了,所以需要商業(yè)化,等不急了。
雷鋒網(wǎng):與做學(xué)術(shù)相比,創(chuàng)業(yè)讓你興奮的點(diǎn)主要是什么?
肖健雄:我覺(jué)得是團(tuán)隊(duì)變化,這也是我們?yōu)槭裁聪雱?chuàng)業(yè)的原因。實(shí)際上很多東西變化非常快,幾個(gè)月后你回頭一想,好像好幾年前的感覺(jué)。而且團(tuán)隊(duì)效率也很高,大家很有斗志,現(xiàn)在是一個(gè)比較大的團(tuán)隊(duì)一起作戰(zhàn),不是單打獨(dú)斗,學(xué)術(shù)還是主要靠單打獨(dú)斗。
公司發(fā)展越來(lái)越快,效率越來(lái)越高,打法越來(lái)越清晰,團(tuán)隊(duì)磨合的速度也很快,很快就進(jìn)入下一個(gè)級(jí)別。當(dāng)然能力的提升是非常強(qiáng)的,這點(diǎn)也是創(chuàng)業(yè)最重要的一點(diǎn),就是快速學(xué)習(xí)能力,在這個(gè)過(guò)程中可以學(xué)到很多。一定要親身體驗(yàn)一遍,才能學(xué)到這么多,很多東西很難靠看書(shū)看出來(lái)。
雷鋒網(wǎng)注:6 項(xiàng)會(huì)員專享特權(quán),全年 100 期精華內(nèi)容,帶你深入淺出看懂自動(dòng)駕駛。如果想加入雷鋒網(wǎng)「新智駕會(huì)員計(jì)劃」,歡迎點(diǎn)擊鏈接 :http://m.ozgbdpf.cn/aidrive/vip 或掃描海報(bào)下方二維碼了解詳情。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。