縱目科技首席科學(xué)家：智能駕駛與視覺感知的3大突破點(diǎn) | GTC China 2016

本文作者：么詠儀

2016-09-13 20:02

導(dǎo)語：縱目科技首席科學(xué)家馬慧敏教授介紹視覺識別小目標(biāo)、強(qiáng)遮擋、高動態(tài)三個問題。

9月13日，GPU 開發(fā)者大會在北京舉辦，上?？v目科技首席科學(xué)家馬慧敏教授針對智能駕駛與視覺感知方面的核心問題做了詳細(xì)的講解。

馬慧敏表示，2003年的3D Image Lab實(shí)驗(yàn)室在清華大學(xué)電子工程系掛牌，他們一直以來關(guān)注的是識別技術(shù)現(xiàn)在沒有攻克的難題。

小目標(biāo)、強(qiáng)遮擋、高動態(tài)三個問題是他們重點(diǎn)要解決的。馬慧敏主要介紹了機(jī)器學(xué)習(xí)在自動駕駛上的3個模型，用來解決上述的3個問題。

縱目科技首席科學(xué)家：智能駕駛與視覺感知的3大突破點(diǎn) | GTC China 2016 1、顯著性物體檢測：語義注意認(rèn)知模型

縱目科技首席科學(xué)家：智能駕駛與視覺感知的3大突破點(diǎn) | GTC China 2016 2、部件與認(rèn)知模型：抵抗遮擋能力

縱目科技首席科學(xué)家：智能駕駛與視覺感知的3大突破點(diǎn) | GTC China 2016 3、3D場景物體識別：適應(yīng)復(fù)雜環(huán)境

首先，在顯著性物體檢測中要找到顯著物體為分割圖像做鋪墊；
其次，部件、結(jié)構(gòu)、環(huán)境3個方面是圖像識別中非常重要的因素，加入部件的特征也可以抵抗遮擋的問題；
最后，再進(jìn)一步就是要和環(huán)境交互，利用三維信息（立體視覺）做物體的語義模型。利用三維做道路的估計(jì)和語義特征再把它投入到二維的單目攝像頭中，會發(fā)現(xiàn)測試結(jié)果與雙目攝像頭效果相當(dāng)。原因就是自身的先驗(yàn)和語義上下維度之間的關(guān)聯(lián)。

在三維的先驗(yàn)測試中，可以確定汽車的高度、寬度以及和建筑物的比例，這些都在一定的范圍之內(nèi)。再從多模態(tài)、多任務(wù)、多視角三方面進(jìn)行道路檢測，從平視到鳥瞰進(jìn)行多維檢測，車輛檢測和定位精度等多方面指標(biāo)都能有6%以上的提升。

他們也將立體視覺和激光雷達(dá)效果以及混合傳感器效果做了比較，但是視覺傳感加入了激光傳感后在道路的測試效果并沒有顯著的提升，甚至還不如二維三維融合的純視覺識別。

在自動駕駛中，車道檢測、交通標(biāo)識燈檢測、道路標(biāo)志以及整體路徑規(guī)劃等都需要在嵌入式發(fā)展的基礎(chǔ)上才能實(shí)現(xiàn)在無人車算法的運(yùn)行中，而實(shí)現(xiàn)智能駕駛和視覺感知，3D Image Lab實(shí)驗(yàn)室用到的就是通過了上述三個模型來解決問題。

縱目科技首席科學(xué)家：智能駕駛與視覺感知的3大突破點(diǎn) | GTC China 2016

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

相關(guān)文章

么詠儀

編輯

發(fā)私信

當(dāng)月熱門文章