0
本文作者: 李星宇 | 2017-01-20 17:02 |
雷鋒網(wǎng)按:本文作者李星宇,地平線智能駕駛商務總監(jiān)。畢業(yè)于南京航空航天大學,獲得了自動化學院測試儀器及儀表專業(yè)的學士和碩士學位;曾任飛思卡爾應用處理器汽車業(yè)務市場經(jīng)理,原士蘭微電?安全技術專家,有13年半導體行業(yè)從業(yè)經(jīng)驗。在加入飛思卡爾的早期,任職于i.MX應用處理器研發(fā)團隊,在該領域取得一項NAND Flash存儲應用美國專利。在士蘭微電子負責安全芯片的公鑰加密引擎設計,該引擎的RSA/ECC加解密性能處于國內(nèi)領先水平。
雷鋒網(wǎng)獲得授權發(fā)布。
本文為CES深度分析第四篇,前面三篇傳送門:
CES深度分析:自動駕駛產(chǎn)業(yè)化邁向縱深(二)
一、目前的硬件效能達不到實用要求
對于自動駕駛這樣的復雜任務,在設計軟件的同時,還必須考慮與之匹配的硬件效能,這里包括性能、功耗和功能安全。
為了保證自動駕駛的實時性要求,我們需要保證軟件響應的最大延遲在可接受的范圍內(nèi),對于計算資源的要求也因此變得極高,目前,自動駕駛軟件的計算 量達到了10個TOPS(每秒萬億次操作)的級別,這使得我們不得不重新思考對應的計算架構,圖靈獎獲得者Alan Kay,他有一句話是喬布斯一直信仰的: 如果你嚴肅地思考你的軟件,你就必須要做你自己的硬件。
圖靈獎獲得者Alan Kay
事實上,整個數(shù)字半導體和計算產(chǎn)業(yè)的產(chǎn)業(yè)驅(qū)動力,正在從手機轉(zhuǎn)向自動駕駛,后者所需要的計算量比手機要大兩個數(shù)量級。
今天,打開任何一家主機廠的無人車的后備箱,都是一堆計算設備,不但沒有地方放行李,而且還要解決它的整個系統(tǒng)穩(wěn)定性問題。之前在烏鎮(zhèn)舉行的世界互聯(lián)網(wǎng)大會,雷鋒網(wǎng)的記者在實際體驗百度的無人車時,提到非常有趣的一點:“這輛無人車平穩(wěn)地行駛了起來,但位于后備箱的車載計算機噪音較大,可以聽到風扇在運行的聲音?!?/span>
百度無人車的后備箱中的車載計算機
為什么呢?因為它使用的是CPU+GPU+FPGA的計算平臺,計算所需要的功率非常大,GPU尤其恐怖,如果沒有強力風扇來散熱的話,夏天很容易燒壞機器。坐在這樣的車里,就別講究體驗了。
功能安全是另一個巨大的挑戰(zhàn),這里面其實包含了多個方面的要求:處理器 要符合至少ASIL-B等級的要求,可靠性需要能夠保證在至少十年的使用期內(nèi)不出問題。
高通在手機領域有非常強的實力,而且向汽車電子進軍的努力也從未停止,但去年高通依然決定花370億美元重金收購了汽車電子老大NXP,這從另一個側(cè)面折射出汽車電子的門檻之高。
二、人工智能處理器與自動駕駛計算平臺
這讓我們想起計算機的發(fā)展歷史,50年代是大型機的時代,那個時候一臺大型機可以占據(jù)實驗樓的一整個樓層,需要一個龐大的團隊來操作,價格高到數(shù)百萬美元;七十年代小型機占據(jù)主導,小型機可以安裝進一個房間,價格也降到數(shù)萬美元;八十年代是PC時代,可以擺放到桌面,價格則又降低了一個數(shù)量級, 如今是手機,可以裝進口袋;貫穿其中的是三個主要方面的進步:體積、功耗和成本。
人工智能所需要的處理器,從2012年開始業(yè)界已經(jīng)開始廣為關注,比如從 GPU到FPGA,再到TPU,業(yè)界也沿著之前計算機走過路,重構人工智能所需要的處理器。
英偉達在本屆CES上發(fā)布了最新的車載計算平臺“XAVIER”,512 個Volta CUDA 核心可提供高達30TOPS的計算性能,但最引人注目的還是其30W的功耗,大大低于之前還需要水冷的Drive PX2。這是一個很大的進步,但還不夠,要讓自動駕駛得到普及,性能、功耗、成本和體積因素,一個也不能少。
英偉達在本屆CES上發(fā)布了最新的車載計算平臺“XAVIER”
如今很多車廠都制定了非常激進的自動駕駛開發(fā)計劃,但其實樣車開發(fā)與其投入到量產(chǎn)車的日程表其實是差異非常大的,與量產(chǎn)車的設計理念完全不同,量產(chǎn)車必須考慮成本因素,不能跟今天的GPU或者其它的計算所需要的成本一樣,而這就需要業(yè)界提供新的計算平臺。
FPGA被越來越多的公司關注,其可編程特性可以滿足專有計算構架的需求,微軟、Intel等公司都在大量部署基于FPGA的系統(tǒng)。
FPGA在ADAS方面的出貨量也在迅速增加,去年的出貨量應該不會低于3Mu。但FPGA再往上走,計算資源的擴展會讓成本上升到很難接受的地步。 半導體業(yè)界無數(shù)的歷史都表明,F(xiàn)PGA往往是定制化ASIC的前哨站,一旦某個 應用的量足夠大,定制化ASIC就會變得更經(jīng)濟。
地平線機器人公司正處于整個業(yè)界研究的最前沿,目標就是將原本智能在云端運行的人工智能,實現(xiàn)在高性能低功耗的大腦引擎(BPU)上,這是一個全新的計算構架IP,將充分適配深度神經(jīng)網(wǎng)絡算法的要求,由此帶來革命性的嵌入式人工智能,預計其成本和功耗都將比現(xiàn)有GPU低一個數(shù)量級。這樣的IP可以嵌入到SoC中,或者單獨作為協(xié)處理器使用。目前地平線正在推進代號為“高斯”的計算構架IP的開發(fā),預計17年底推出。
地平線BPU戰(zhàn)略
三、軟硬件協(xié)同設計是新的趨勢
在過去,處理器都是作為標準平臺提供給業(yè)界,軟件工程師拼命優(yōu)化編譯器、 代碼、任務調(diào)度等來達到更高的性能表現(xiàn),但現(xiàn)在,這已經(jīng)無法滿足產(chǎn)品快速上市的要求了。
英偉達在AI業(yè)界攻城略地,幾乎已經(jīng)成為標配,這其中有其高性能GPU的因素,但問題在于,為什么其它GPU供應商沒有贏得這場競爭?
英偉達不僅提供GPU硬件,還提供了高度優(yōu)化的CUDA平臺,該平臺封裝了大量高頻使用的數(shù)學運算庫,英偉達更進一步面向自動駕駛提供了端到端的解決方案,這實際上是一種重要的產(chǎn)品理念:軟硬件協(xié)同設計。
這揭示了英偉達市場競爭成功的秘訣:通過軟硬件協(xié)同設計,優(yōu)化軟硬件系統(tǒng)的性能表現(xiàn),縮短客戶導入時間,贏得市場。
新的自動駕駛計算平臺,實際上是因應算法和軟件的需求而來的,例如,為了更好地支持深度卷積神經(jīng)網(wǎng)絡極大規(guī)模的矩陣運算,你需要考慮如何使用二值化方法來降低對于硬件乘法器的需求,如何重新設計緩存機制以避免I/O帶寬成為整個計算系統(tǒng)的瓶頸等。為了滿足功能安全的需求,你需要硬件級別的虛擬化,這就要求處理器構架設計方面需要考慮多核、VMM、設備I/O請求管理等。
Intel也在加強其在人工智能算法方面的積累,對Nervana和Movidius的收購反映了這一點。通過提供至強處理器、FPGA,結(jié)合其Nervana平臺以及面向深度學習優(yōu)化的數(shù)學函數(shù)庫(MKL),提供完整的AI解決方案。
能否提供同時滿足經(jīng)濟性和性能要求的計算平臺,是自動駕駛能否從樣車轉(zhuǎn)向量產(chǎn)車的關鍵因素之一。
結(jié)語
公眾對于自動駕駛依然有深深的疑慮,但在每一次革命性的交通運輸方式出現(xiàn)時,類似的疑慮都曾經(jīng)存在過。航空服務剛剛出現(xiàn)時,安全性非常低,多數(shù)人甚至都不相信金屬構造能飛起來,美國海軍統(tǒng)計表明,在二戰(zhàn)期間,因技術原因損失的飛機達2100架,是被擊落飛機的1.5倍,但航空業(yè)依然發(fā)展了起來;高鐵同樣有類似的經(jīng)歷,19世紀火車剛剛出現(xiàn)時,即使是最有遠見的人都無法想象時速超過300公里的列車,那時候的人們認為僅僅是氣壓的問題就足以讓乘客喪命,而后來這些都成為了現(xiàn)實,并且發(fā)展了體量驚人的配套基礎設施:鐵道和機場。當技術不存在原理性的問題之后,只要有巨大的商業(yè)潛力,利益的驅(qū)動終能克服技術上的挑戰(zhàn)。
如果我們考察一段文明的發(fā)達程度,運輸水平可能是最直觀的指標。唐代玄奘取經(jīng),鑒真東渡,耗去的是一個人半生的時間,這里體現(xiàn)的是客運成本;南宋時期,從福建泉州出發(fā)的瓷器運到歐洲,增值達一百倍,體現(xiàn)的是貨運的價值;19世紀美國的崛起,很大程度上得益于其全國鐵路網(wǎng)的建立,將聯(lián)邦的各個州 融合成為一個單一市場。
文明的發(fā)展過程,也必然伴隨著運輸成本的逐漸降低,以及運輸效率的持續(xù)提升,它深刻重塑了經(jīng)濟的形態(tài)。Elon Musk的終極夢想是殖民火星,同樣是一個運輸能力改變文明的故事,自動駕駛就是當下發(fā)生的故事,當人的勞動力被釋放之后,成本下降就會驅(qū)動一波全新的機會,過去一年里,自動駕駛領域的進步 已經(jīng)超出了絕大多數(shù)人的預期,自動駕駛的未來值得期待。
本系列更新完結(jié)。
雷峰網(wǎng)特約稿件,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。