1
本文作者: 叨叨 | 2017-04-25 22:32 |
雷鋒網(wǎng)【新智造】按:SLAM 技術(shù)最早被用于核潛艇的海底定位,近年來逐漸進(jìn)入民用領(lǐng)域,尤其是掃地機(jī)器人在消費市場的推廣,使得SLAM作為機(jī)器視覺的解決方案,備受重視?;谌S視覺的 vSLAM 技術(shù)也被廣泛應(yīng)用與機(jī)器人、VR、自動駕駛等智能設(shè)備上。本篇文章為雷鋒網(wǎng)新智造頻道 SLAM 專題的其中一篇,對初創(chuàng)企業(yè)遠(yuǎn)形時空的報道,主要介紹了其用于智能設(shè)備的視覺感知傳感器和配套的軟件解決方案,以及創(chuàng)始團(tuán)隊對于市場、技術(shù)的看法。
雷鋒網(wǎng)正在啟動“新智造成長榜2017”評選活動,我們將對人工智能與機(jī)器人行業(yè)進(jìn)行大規(guī)模報道、梳理和調(diào)研,并聯(lián)合數(shù)十家著名投資機(jī)構(gòu)根據(jù)這些創(chuàng)新公司的技術(shù)實力、商業(yè)能力和成長性進(jìn)行深度評選,最終從多個領(lǐng)域分別選出一些極具潛力成長性的創(chuàng)新公司。如果你想?yún)⑴c我們的評選,可點擊「報名」鏈接,或通過郵箱xinzhizao@leiphone.com聯(lián)系我們!
華中科大光電子專業(yè)畢業(yè)后,李昌檀先后在索尼、飛利浦、聯(lián)想等大廠里工作了十幾年,具體工作略有差別,但核心一直沒變,那就是圍繞“光電子”,做手機(jī)攝像頭的系統(tǒng)、硬件、底層軟件和集成。
在這個行當(dāng)里,李昌檀取得了不少成績,比如在 iphone 還沒有光學(xué)防抖功能的時候,他做了中國第一款光學(xué)防抖手機(jī),雖然由于各種原因,賣的并不好。十多年的研究,李昌檀希望自己能站在更高的維度上來看產(chǎn)品,他想知道用戶真實的需求是什么,也想知道如何能做出有用的產(chǎn)品,但大廠分工細(xì)致,層級嚴(yán)格,已經(jīng)無法滿足他的需求。
于是,2014年李昌檀開始了第一次創(chuàng)業(yè),作為初始團(tuán)隊加入了一個 VR 公司 。這次創(chuàng)業(yè)最大的收獲,就是讓他結(jié)識了黃石生博士。黃石生畢業(yè)于清華大學(xué)計算機(jī)系,師從計算機(jī)圖形學(xué)領(lǐng)域的胡事民教授,在過去一直專注于圖像與視頻等媒體的研究,在圖形學(xué)與視覺領(lǐng)域的頂級學(xué)術(shù)會議(SIGGRAPH/SIGGRAPH Asia/TVCG)上,發(fā)表過四篇文章。
相識一年之后,李昌檀聯(lián)合黃博士,創(chuàng)辦遠(yuǎn)形時空,開始了第二段創(chuàng)業(yè)生涯。李昌檀對雷鋒網(wǎng)新智造說:
我們要做一些有用的事情,技術(shù)門檻高,是一門手藝活,有很多坑,需要一個一個爬出來,不是模式的創(chuàng)新,也沒有很大的杠桿。
這個手藝活,就是基于視覺的 vSLAM 軟硬件解決方案。在李昌檀看來,原先做的手機(jī),現(xiàn)在流行的VR、無人車、無人機(jī)等沒有本質(zhì)的區(qū)別,都是用于人機(jī)交互的一個工具,底層技術(shù)是相通的。但有個區(qū)別在于,原先做相機(jī),主要是讓人看,現(xiàn)在是要讓機(jī)器能夠看懂。
雷鋒網(wǎng)新智造了解到,SLAM 技術(shù)的全稱為 simultaneous localization and mapping ,即實時定位及地圖構(gòu)建,SLAM 并不是一項新技術(shù),國內(nèi)外都有數(shù)十家公司在研究。黃石生介紹說,無論是定位還是地圖,分開做都不是難事,難點在于結(jié)合,同時要保證即時。
SLAM 不僅僅是一項技術(shù),其實更是一個包含傳感器和算法實現(xiàn)的系統(tǒng)。在傳感器方面,可以選擇的比較多,比如激光雷達(dá)、攝像機(jī)、視覺里程計、GPS等,主流的是激光雷達(dá)和攝像機(jī)。
有了傳感器感知環(huán)境之外,還需要算法實現(xiàn),讓機(jī)器“看得見”。遠(yuǎn)形時空選擇的解決方案是攝像頭+慣性導(dǎo)航+算法。黃石生認(rèn)為,這樣的解決方案,有以下幾個優(yōu)勢:
小型化
雖然激光雷達(dá)精度可以達(dá)到毫米級,但在工程上無法小型化,尤其是旋轉(zhuǎn)式的激光雷達(dá)。從目前在自動駕駛領(lǐng)域的實現(xiàn)來看,都需要給激光雷達(dá)預(yù)留很大的空間,在 VR/AR 等小型設(shè)備上,幾乎沒有用武之地。
成本低
激光雷達(dá)成本相當(dāng)高昂,旋轉(zhuǎn)式的激光雷達(dá)成本在8000-80000美元之間,固態(tài)雷達(dá)相對便宜不少,但相比攝像頭還是非常昂貴,這對于廠商來說,成本很高。
響應(yīng)頻率高
激光雷達(dá)的響應(yīng)頻率不如攝像頭,可以輕松達(dá)到50-60赫茲,慣性導(dǎo)航則更高,可以達(dá)到1000赫茲,這樣輸出信息時就非常快。
擴(kuò)展性強(qiáng)
使用攝像頭的解決方案,除了用來實時定位構(gòu)建地圖外,用戶還可以利用它擴(kuò)展其他功能,比如人臉識別、手勢等其他視覺識別的功能。
特別就 VR 領(lǐng)域而言,現(xiàn)有的視覺解決方案都是由外而內(nèi)的追蹤,比如通過 Lighthouse 和 Constellation 的高精度追蹤系統(tǒng),而遠(yuǎn)形時空提供的 SLAM 解決方案,則不需要配合,是一體化的解決方案。
但以攝像頭為主的解決方案采集到的信息量大,背后需要配套非常強(qiáng)大的算法來進(jìn)行處理。經(jīng)過李昌檀和黃石生的努力,在雙目 SLAM 和單目 SLAM 兩方面,算法和性能都有了非常大的提升。
在vSLAM學(xué)術(shù)研究方面,有很多優(yōu)秀的工作,有的已經(jīng)開源(例如ORBSLAM、LSD-SLAM、OKVIS、DSO、ORB-VIO、SVO等),為追求準(zhǔn)確性這些方法往往采用計算強(qiáng)度很高的視覺優(yōu)化(Bundle Adjustment),導(dǎo)致計算功耗很難降低,而純視覺的 SLAM 往往受光照條件、高速旋轉(zhuǎn)運動、抖動等等影響而產(chǎn)生不穩(wěn)定,因此,這些方法在產(chǎn)品化在實際產(chǎn)品化過程中有較大難度。
遠(yuǎn)形時空推出的雙目 SLAM 和單目 SLAM ,不僅僅依靠攝像頭,還輔助慣性傳感器(即 Visual-Inertial SLAM),很大程度上克服了純視覺 SLAM 的缺點。另外,為提高穩(wěn)定性和精度,遠(yuǎn)形時空團(tuán)隊在傳感器硬件、慣性輔助的圖像特征追蹤、丟失重定位等核心技術(shù)方面都做了優(yōu)化,提高了 vSLAM 的穩(wěn)定性和精度。
雙目 SLAM 表現(xiàn)
單目 SLAM 表現(xiàn)
遠(yuǎn)形時空團(tuán)隊推出的雙目 SLAM 和單目 SLAM 的精度均在厘米級,drift 小于1%,而計算功耗很小,比同類產(chǎn)品減小超過至少一半以上的計算量,最低時只是1/4左右。
在機(jī)器視覺領(lǐng)域,其實存在著眾多玩家,比如百度前日剛收購的硅谷公司 xPerception,其定位和業(yè)務(wù)范圍與遠(yuǎn)形時空非常類似,國內(nèi)還有格靈深瞳、速感科技、Human+、拓視覺等初創(chuàng)企業(yè)。面對競爭相對激烈的市場,李昌檀認(rèn)為:
其實我們也看到一些比較優(yōu)秀的創(chuàng)業(yè)團(tuán)隊,我們覺得非常好,大家能夠一起教育市場,把這個市場做大。而且,暫時還沒有一個可以通吃產(chǎn)品,我們非常希望做一個能用在很多領(lǐng)域的產(chǎn)品,但實際上還不存在通用的解決方案。所以,無論競爭是否激烈,必須得在某一個細(xì)小的領(lǐng)域扎根下來,再拓展更容易一些。
目前,遠(yuǎn)形時空基于這種解決方案,做出了一個嵌入式的硬件產(chǎn)品,并將首先在 VR 領(lǐng)域進(jìn)行落地,國內(nèi)外各有一家 VR 廠商已在洽談合作,預(yù)計在年內(nèi)會有進(jìn)一步消息?,F(xiàn)在公司共有10人左右的技術(shù)團(tuán)隊,已完成數(shù)百萬的天使輪融資,即將開始下一輪的融資計劃,大概千萬量級。新一輪融資將會用于產(chǎn)品量產(chǎn)、新品研發(fā)、團(tuán)隊擴(kuò)充三個方面。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。