0
本文作者: 岑大師 | 2017-11-17 03:47 |
現(xiàn)在的各種學術(shù)會議多如牛毛,一個大會質(zhì)量高不高,除了看大會后的組織者是誰之外,另一個重要因素的是看這個學術(shù)會議上出過哪些重要的論文。如伯克利 BAIR Blog 編委會成員、在讀博士許華哲就和雷鋒網(wǎng)記者開過玩笑,如果要組織一個新的會議,會議組織者不僅需要邀請重量級的演講嘉賓,另一個任務(wù)是盯著自己的學生做出一兩篇有影響力的論文來,這樣就可以讓大家知道這個會不是水會,第二年參加的人就多了。這固然是個玩笑,但對第一屆舉辦的學術(shù)會議來說,論文質(zhì)量一定是非常重要的。
近日在山景城召開的第一屆CoLR大會上,雷鋒網(wǎng)也重點了解了這屆大會論文投遞的情況。
從大會官方統(tǒng)計數(shù)據(jù)看,本次大會總共收到212篇論文,數(shù)量最大的三個論文類別分別為增強學習、模型學習和機器人視覺;
在現(xiàn)場Oral presentation環(huán)節(jié),長論文的講解時間為20分鐘,短論文講解時間為6分鐘。
以下是雷鋒網(wǎng)在現(xiàn)場發(fā)現(xiàn)的若干有意思的論文:
1. 《One-Shot Visual Imitation Learning via Meta-Learning》
作者:Chelsea Finn , Tianhe Yu , Tianhao Zhang, Pieter Abbeel, Sergey Levine
摘要:為了讓機器人成為可以廣泛地執(zhí)行通用工作,其必須能在復雜的非結(jié)構(gòu)化環(huán)境中快速有效地獲取各種各樣的技能。 像深度神經(jīng)網(wǎng)絡(luò)這樣的高容量模型可以使機器人展示出復雜的技能,但是從頭開始學習每個技能就變得不可行。 在本論文中,我們提出了一種元模擬學習方法,使機器人學習如何更有效地學習,從而使其能夠從單個演示中獲得新的技能。 與先前的單次模擬方法不同,我們的方法可以擴展到原始像素輸入,所需要前期任務(wù)數(shù)量也大大減少,從而更有效地學習新技能。 我們在模擬機器人和真實機器人平臺上進行的實驗均證明了從單個視覺演示中學習端到端的新任務(wù)的能力。
點評:這篇論文是雷鋒網(wǎng)很早就發(fā)現(xiàn)的一篇論文,詳見《BAIR論文:通過“元學習”和“一次性學習”算法,讓機器人快速掌握新技能》
2. 《image2mass: Estimating the Mass of an Object from Its Image》
作者:Trevor Standley, Ozan Sener, Dawn Chen, Silvio Savarese
摘要:機器人操縱真實世界中的物體需要理解這些對象的物理屬性。 我們提出了一個從物體的圖像中估計物體質(zhì)量的模型, 我們收集了包含圖像,大小和重量等信息的大型數(shù)據(jù)集,并比較了在這個數(shù)據(jù)集上訓練的圖像的質(zhì)量的幾個基準模型。同時,我們對比了也在這個問題上人的表現(xiàn)。 最后,我們提出了一個考慮到對象的3D形狀的模型, 這個模型比上述基準和與人類的表現(xiàn)相比都要更好。
點評:斯坦福Copmutational Vision & Geometry Lab的Silvio Savarese教授團隊的一篇文章,看一張圖片,預(yù)測物體的重量,這個應(yīng)用很酷。據(jù)第一作者Trevor Standley介紹,他們使用Amazon的API接口獲取大量商品信息作為數(shù)據(jù)集,除了估計體積和密度的兩個模塊,還有一個專門估計物體3D形狀的神經(jīng)網(wǎng)絡(luò)模塊,從而進一步保證物體估計的準確度。
3.《Neural Task Programming: Learning to Generalize Across Hierarchical Tasks》
作者:Danfei Xu, Suraj Nair, Yuke Zhu, Julian Gao, Animesh Garg, Li Fei-Fei, Silvio Savarese
摘要: 在本論文中,我們提出了一種名為神經(jīng)任務(wù)編程(NTP)的新型機器人學習框架,該方法可以通過較少的示范和神經(jīng)程序引導進行學習。NTP可將輸入的規(guī)范性任務(wù)(例如任務(wù)的視頻演示)遞歸地將其分解成更精細的子任務(wù)規(guī)范, 這些規(guī)范被傳遞到分級神經(jīng)程序,通過可調(diào)用的底層子程序是與環(huán)境進行交互。同時,我們在三個機器人操縱任務(wù)中驗證了我們的方法,在試驗中,NTP展示了在顯示分層結(jié)構(gòu)和組合結(jié)構(gòu)的順序任務(wù)的強泛化能力化。 實驗結(jié)果表明,NTP在學習長度不定、可變拓撲和不斷變化的未知任務(wù)的學習和拓展有較好的效果。
點評:雖然李飛飛團隊之前的研究更多是在計算機視覺領(lǐng)域,但正是如此,才有可能從機器人領(lǐng)域研究者習慣的視角外去思考問題,這篇論文提出的新思路也值得機器人研究者注意。
4.《Intention-Net: Integrating Planning and Deep Learning for Goal-Directed Autonomous Navigation》
作者:Wei Gao, Wee Sun Lee, Shengmei Shen,Karthikk Subramanian
摘要:如何將送貨機器人可靠地導航到新辦公大樓中的目的地,并提供最少的先驗信息? 為了應(yīng)對這一挑戰(zhàn),本文介紹了一種兩層次的分級方法,它集成了無需模型的深度學習和基于模型的路徑規(guī)劃。 在低層次上,一個叫做意圖網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)運動控制器被端對端地訓練用于提供魯棒的本地導航。 意圖網(wǎng)絡(luò)將來自單個單目照相機的圖像和“意圖”直接映射到機器人控制器。 在高層,路徑規(guī)劃者使用粗略地圖(例如二維平面圖)來計算從機器人當前位置到目標的路徑, 計劃的路徑向意圖網(wǎng)絡(luò)提供意圖。 初步的實驗表明,學習的運動控制器是強大的,不受感知的不確定性的影響,并通過與路徑規(guī)劃器的整合,有效地推廣到新的環(huán)境和目標。
點評:未來的無人駕駛車輛能否像人類一樣,憑借Google Maps就能自動駕駛?這顯然是一個讓無人駕駛更接近“人”的研究。
5. 《Emergent Behaviors in Mixed-Autonomy Traffic》
作者:Cathy Wu,Aboudy Kreidieh, Eugene Vinitsky, Alexandre M. Bayen
摘要:交通動態(tài)往往是一個復雜的動力系統(tǒng)建模,傳統(tǒng)的分析工具可能難以提供由交通運輸機構(gòu)和規(guī)劃者使用的易處理的策略。如果將自動車輛引入交通系統(tǒng),需要了解自動化對交通網(wǎng)絡(luò)的影響。本文闡述并采用增強學習(RL)的強大框架來處理混合交通控制問題(存在自動駕駛車輛和人類司機)中由此產(chǎn)生的政策和緊急行為,提供了通過混合車隊的自動化和人類司機車輛實現(xiàn)交通自動化的潛力。無模式學習方法被證明自然選擇之前由模型驅(qū)動的方法設(shè)計的政策和行為,例如穩(wěn)定和排隊,可以有效提高環(huán)路效率甚至超過理論速度極限。值得注意的是,RL通過有效地利用人類駕駛行為的結(jié)構(gòu)來成功地使速度最大化,以形成交叉口網(wǎng)絡(luò)的有效車輛間距。我們在穩(wěn)定性分析和混合自治分析的現(xiàn)有控制理論結(jié)果的背景下描述我們的結(jié)果。
點評:如果自動駕駛車輛達到5%,對我們的交通會產(chǎn)生什么影響?這一論文的試驗中展示了在一個21輛人類司機和1輛無人駕駛車在環(huán)形路段的模擬情況,整個運行效率可提高60%?,F(xiàn)實交通狀況可能更為復雜,但如果無人車的加入可以更好地解決擁堵問題,毫無疑問對無人車是個大利好消息。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。