0
雷鋒網(wǎng) AI 科技評(píng)論按:機(jī)器學(xué)習(xí)、人工智能領(lǐng)域的研究人員,以及任何學(xué)術(shù)研究人員,都關(guān)心這兩件事:分享、傳播自己的研究成果讓更多人知道,以及了解自己研究方向的最新進(jìn)展、結(jié)識(shí)更多的研究人員。雷鋒網(wǎng) AI 研習(xí)社大講堂就是一個(gè)供研究人員們分享自己成果、促進(jìn)廣泛溝通互動(dòng)的直播平臺(tái)。
自 AI 大講堂去年 7 月上線以來, 已經(jīng)有來自清華大學(xué)、北京大學(xué)、上海交通大學(xué)、香港科技大學(xué)、 MIT、UC Berkeley、悉尼科技大學(xué)等知名國(guó)內(nèi)外高校的嘉賓進(jìn)行直播分享,甚至還舉辦了線下論文分享會(huì),迄今已完成了 68 期,覆蓋影響讀者過萬(wàn)人。不僅嘉賓自己的研究成果被直播觀眾以及讀者們了解,也讓科技愛好者們、學(xué)生們、其它研究人員們?cè)鲞M(jìn)了對(duì)人工智能相關(guān)思維、知識(shí)、應(yīng)用的認(rèn)識(shí),為國(guó)內(nèi)人工智能長(zhǎng)期持續(xù)發(fā)展的氛圍出一份力。
人工智能相關(guān)的各個(gè)研究方向中,最為豐富也最為熱門的當(dāng)屬計(jì)算機(jī)視覺(CV)了,其中的熱門任務(wù)包括圖像分類、對(duì)象檢測(cè)、圖像分割、圖像生成、圖像描述生成等等。下面我們匯總了近期(2018 年以來)9 期精彩的計(jì)算機(jī)視覺方向分享回顧。
分享嘉賓:劉漢唐,浙江大學(xué)計(jì)算機(jī)系博士生。
圖像分割是計(jì)算機(jī)視覺中一個(gè)經(jīng)典并且基礎(chǔ)的問題,對(duì)于理解圖像非常關(guān)鍵。圖像分割有很多應(yīng)用場(chǎng)景,比如無(wú)人駕駛、地圖重建、圖像美化等等。深度學(xué)習(xí)使得圖像分割有了巨大的發(fā)展,本次分享會(huì)介紹深度學(xué)習(xí)中圖像分割的經(jīng)典算法。
分享嘉賓:黃靖佳,北京大學(xué)深圳研究生院信息工程學(xué)院二年級(jí)博士生。
視頻中的行為檢測(cè)是當(dāng)下的熱點(diǎn)研究任務(wù),該任務(wù)要求從一段未經(jīng)修剪的(untrimmed)視頻中找出目標(biāo)行為發(fā)生的時(shí)間區(qū)間。由于目標(biāo)行為可能發(fā)生的時(shí)間點(diǎn)以及目標(biāo)行為的持續(xù)時(shí)間均是不確定的,使得在完成這項(xiàng)任務(wù)時(shí)往往需要花費(fèi)大量的計(jì)算資源對(duì)不同時(shí)間尺度(長(zhǎng)度),不同起點(diǎn)的視頻片段進(jìn)行判斷。為了避免這種低效的檢測(cè)方法,我們提出了一種可以自適應(yīng)調(diào)整檢測(cè)窗口大小及位置的方法,對(duì)視頻進(jìn)行高效的檢測(cè)。
分享嘉賓:何詩(shī)怡,北京大學(xué)計(jì)算機(jī)視覺碩士,優(yōu)必選悉尼AI研究院學(xué)生。
與單標(biāo)簽圖像分類相比,多標(biāo)簽圖像分類是一種更符合真實(shí)世界客觀規(guī)律的方法,尤其在圖像和視頻的語(yǔ)義標(biāo)注,基于內(nèi)容的圖像檢索等領(lǐng)域有著廣泛的應(yīng)用。因此,本次公開課,何詩(shī)怡將分享她用強(qiáng)化學(xué)習(xí)解決多標(biāo)簽圖像分類問題的方法和經(jīng)驗(yàn)
分享嘉賓:王薇月,南加州大學(xué)計(jì)算機(jī)系在讀博士。
隨著激光雷達(dá),RGBD相機(jī)等3D傳感器在機(jī)器人,無(wú)人駕駛領(lǐng)域的廣泛應(yīng)用,深度學(xué)習(xí)在三維點(diǎn)云數(shù)據(jù)的研究在近兩年取得了廣泛關(guān)注。點(diǎn)云分割、識(shí)別、檢測(cè)成為學(xué)術(shù)界、工業(yè)界的熱門話題之一。是在本次公開課中,講者將分享其關(guān)于點(diǎn)云分割的最新工作。
分享嘉賓:張宇倫,美國(guó)東北大學(xué)計(jì)算機(jī)工程在讀博士,Adobe 公司深度學(xué)習(xí)研究實(shí)習(xí)生
圖像超分辨率技術(shù)作為底層計(jì)算機(jī)視覺任務(wù),有著廣泛的應(yīng)用場(chǎng)景,比如:手機(jī)圖像增強(qiáng),視頻監(jiān)控,醫(yī)療影像,衛(wèi)星圖像,低分辨率人臉識(shí)別。因此,圖像超分辨率技術(shù)吸引了眾多來自學(xué)術(shù)界與工業(yè)界的研究興趣。但是,當(dāng)前圖像超分辨率技術(shù)仍然面臨一些難題,比如,對(duì)高放大倍數(shù)的圖像超分辨,難以恢復(fù)丟失的細(xì)節(jié);對(duì)已經(jīng)恢復(fù)出的細(xì)節(jié),也有著模糊等效應(yīng),其質(zhì)量有待提升。因此,本次公開課,張宇倫同學(xué)設(shè)計(jì)一種新的網(wǎng)絡(luò)結(jié)構(gòu),得到更強(qiáng)的表達(dá)能力,不僅將之前方法難以恢復(fù)的細(xì)節(jié)恢復(fù)出來了,而且,結(jié)果更清晰。最終,在不同圖像退化模型下都達(dá)到了當(dāng)前較好的結(jié)果。
分享嘉賓:姜仲石,紐約大學(xué)科朗數(shù)學(xué)研究所(NYU Courant) 二年級(jí)博士生。
網(wǎng)格是幾何數(shù)據(jù)的常用高效表示, 在幾何曲面構(gòu)建的機(jī)器學(xué)習(xí)方法對(duì)計(jì)算機(jī)圖形學(xué),3D計(jì)算機(jī)視覺以及幾何分析和處理有著重要的意義。
分享嘉賓:任中正,現(xiàn)UIUC攻讀計(jì)算機(jī)博士。
現(xiàn)在的神經(jīng)網(wǎng)絡(luò)可以通過監(jiān)督學(xué)習(xí)學(xué)到很好的遷移學(xué)習(xí)本領(lǐng),然而卻需要百萬(wàn)級(jí)別的手工標(biāo)注數(shù)據(jù)。自監(jiān)督(self-supervised)任務(wù)就是一種為了取代標(biāo)注數(shù)據(jù)的方式。 然而已有的自監(jiān)督方法大部分是單任務(wù),導(dǎo)致模型容易在這個(gè)任務(wù)上過擬合。任博士分享了用合成數(shù)據(jù)做多任務(wù)特征學(xué)習(xí)的工作,以及如何使用domain adaptation來讓學(xué)到的特征更好的遷移到真實(shí)世界的視覺任務(wù)上。
分享嘉賓:胡梟瑋,香港中文大學(xué)二年級(jí)博士生。
陰影檢測(cè)是計(jì)算機(jī)視覺中基礎(chǔ)并富有挑戰(zhàn)性的問題。檢測(cè)陰影區(qū)域,為進(jìn)一步獲取圖像中的光照情況、物體的形狀與位置,以及攝像機(jī)的參數(shù)提供了可能,同時(shí)陰影的存在為目標(biāo)的檢測(cè)與跟蹤帶來了障礙。檢測(cè)陰影區(qū)域需要理解圖像全局的語(yǔ)義信息,本文提出通過方向性地分析圖像空間上下文信息來理解陰影,同時(shí)設(shè)計(jì)了DSC模型用于檢測(cè)、去除陰影,并在兩個(gè)陰影檢測(cè)數(shù)據(jù)集以及兩個(gè)陰影去除數(shù)據(jù)集上都達(dá)到了頂尖的性能。這篇論文已被CVPR 2018收錄,并做口頭報(bào)告(Oral)。
分享嘉賓:劉晨,圣路易斯華盛頓大學(xué)計(jì)算機(jī)系在讀博士。
隨著增強(qiáng)現(xiàn)實(shí),家務(wù)機(jī)器人等應(yīng)用的普及,室內(nèi)場(chǎng)景重建研究正在得到越來越廣泛的關(guān)注。與傳統(tǒng)底層密集重建方法不同,講者的研究集中在分析重建場(chǎng)景中的高層結(jié)構(gòu)化信息。在本次公開課中,講者將分享其結(jié)構(gòu)化重建的最新工作。
大講堂系列直播分享持續(xù)進(jìn)行中。更多精彩研究成果分享、更多往期內(nèi)容匯總,請(qǐng)繼續(xù)關(guān)注雷鋒網(wǎng)相關(guān)內(nèi)容。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。