2
本文作者: 天諾 | 2017-05-16 22:13 |
雷鋒網(wǎng)「新智造」正在啟動“新智造成長榜2017”評選活動,雷鋒網(wǎng)「新智造」將對人工智能與機(jī)器人行業(yè)進(jìn)行大規(guī)模報道、梳理和調(diào)研,并聯(lián)合數(shù)十家著名投資機(jī)構(gòu)根據(jù)這些創(chuàng)新公司的技術(shù)實力、商業(yè)能力和成長性進(jìn)行深度評選,最終從多個領(lǐng)域分別選出一些極具潛力成長性的創(chuàng)新公司。如果你想?yún)⑴c雷鋒網(wǎng)「新智造」的評選,可點(diǎn)擊「報名」鏈接,或通過郵箱xinzhizao@leiphone.com聯(lián)系我們!
最近,卡內(nèi)基梅隆大學(xué)機(jī)器人專家 Dhiraj Gandhi,Lerrel Pinto 和 Abhinay Gupta 發(fā)表了一篇題為《通過墜機(jī)學(xué)習(xí)如何飛行》的論文,在此,不妨讓我們來看看這項研究究竟是什么:
模擬世界和現(xiàn)實世界之間的最大差距,其實就是感知問題。絕大多數(shù)無人機(jī)實驗都避免大量使用實際數(shù)據(jù),因為現(xiàn)實中無人機(jī)墜機(jī)情況時有發(fā)生!在這篇論文中,我們就“勉為其難”,從收集無人機(jī)自己墜機(jī)的數(shù)據(jù)集合入手!我們開發(fā)了一款無人機(jī),它只有一個目的,就是撞向物體墜機(jī)……我們會使用所有這些墜機(jī)數(shù)據(jù)和相同軌跡采樣的正常飛行數(shù)據(jù)相結(jié)合,然后讓無人機(jī)學(xué)習(xí)一個簡單、且強(qiáng)大的導(dǎo)航策略。
聽起來是不是很酷?現(xiàn)在,就讓我們開始墜機(jī)吧!
在思考如何成功飛行(或是駕駛、步行、以及其他任何形式的運(yùn)動)時,一個方法就是讓無人機(jī)不斷地出現(xiàn)飛行失敗、墜機(jī)——就像孩子學(xué)習(xí)走路時會經(jīng)常摔倒一樣。從這個角度來看,學(xué)習(xí)飛行最有效的方法,就是通過從摧毀中得到大量經(jīng)驗,這樣才能學(xué)會如何避免出現(xiàn)墜毀。一旦你可以成功避免碰撞,那么基本上就能知道該如何飛行了,是不是很簡單?然而,我們往往不會采用這種學(xué)習(xí)方式,因為無論是對機(jī)器人,還是對人類而言,墜毀通常都是非常糟糕的一種結(jié)果。
卡內(nèi)基梅隆大學(xué)的機(jī)器人專家則希望另辟蹊徑,和過去人們盡可能嘗試尋找不去讓無人機(jī)墜毀的解決方案不同,他們能夠從無人機(jī)墜毀中找到一條新方法,因此他們研發(fā)了一款 AR Drone 2.0 無人機(jī),可以在二十多種室內(nèi)環(huán)境下不斷墜毀——短短四十小時的飛行時間中,這款無人機(jī)就墜毀了 11.5 萬次。正如研究人員所指出的那樣:“由于無人機(jī)的外殼價格很便宜,而且易于更換,所以即便出現(xiàn)災(zāi)難性故障,成本也可以忽略不計?!泵看闻鲎捕际请S機(jī)的,無人機(jī)會在室內(nèi)空間內(nèi)的隨機(jī)位置起飛,然后開始緩慢超前飛行,直到撞上某個物體。之后,它會重新回到起點(diǎn),然后再選擇一個新方向——當(dāng)然,前提是這款無人機(jī)還能繼續(xù)飛。
在此過程中,無人機(jī)的前置攝像機(jī)會以 30 Hz 的頻率來記錄圖像。一旦碰撞發(fā)生之后,飛行軌跡上的圖像就會被分成兩部分:一部分是無人機(jī)正常飛行的,另一部分則是墜毀一瞬間的圖像。這兩部分圖像集合會被發(fā)送給一個深度卷積神經(jīng)網(wǎng)絡(luò),利用人工智能技術(shù)來學(xué)習(xí)、分析給定的拍攝圖像,然后判斷直線飛行是否是一個好主意。在 11.5 萬次碰撞之后,算法所學(xué)習(xí)到的經(jīng)驗已經(jīng)能夠讓無人機(jī)自主飛行了,即便是在狹窄、混亂的環(huán)境中,無人機(jī)也能輕松避開障礙物,甚至是一些毫無明顯特征的白色墻壁和玻璃門,無人機(jī)也能躲開。不僅如此,控制無人機(jī)的算法其實也很簡單:它將 AR Drone 無人機(jī)的前置攝像頭拍攝的圖像分割成了左圖像和右圖像,如果這兩個圖像中的任意一個看起來比較不容易出現(xiàn)碰撞,那么無人機(jī)就會朝那個方向飛行,否則無人機(jī)將會繼續(xù)保持直線飛行。
那么,這種解決方案是否有效呢?坦白說,無人機(jī)自主飛行效果肯定沒有人類直接操控的那么好,不過在相對比較復(fù)雜的環(huán)境中,比如狹窄的走廊和布滿椅子的走廊里,人類反應(yīng)往往沒有機(jī)器算法判斷的快。
最后一個顯而易見的問題,那就是這種解決方案,是否比傳統(tǒng)訓(xùn)練無人機(jī)學(xué)習(xí)飛行的方法更好?畢竟,這種解決方案是教導(dǎo)無人機(jī)墜毀,而不是飛行。實際上,現(xiàn)在我們都還不知道答案是什么,但最重要的是,如果允許無人機(jī)墜機(jī),那么整個學(xué)習(xí)過程都可以是自我監(jiān)督的:就把無人機(jī)放到一個房間里,讓它自己飛、自己撞、自己墜毀——當(dāng)然你得去給它更換電池,而除了更換電池之外,你所收集的數(shù)據(jù)、以及無人機(jī)學(xué)習(xí)過程完全都是自主完成的。另一方面,如果你試圖較無人機(jī)不要碰撞,那么就必須還得找到一種方法來確保它不會墜毀。當(dāng)然,你可以通過從人類飛行員身上學(xué)習(xí),或是把無人機(jī)放置在具有運(yùn)動捕捉系統(tǒng)以及一些部署 3D 障礙物的環(huán)境下飛行,不過所有這些解決方案都會增加大量成本和復(fù)雜度。所以,讓無人機(jī)從墜機(jī)中學(xué)習(xí)飛行,要容易的多。
VIA ieee
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。