0
雷鋒網(wǎng) AI 科技評論按:機(jī)器學(xué)習(xí)、人工智能領(lǐng)域的研究人員,以及任何學(xué)術(shù)研究人員,都關(guān)心這兩件事:分享、傳播自己的研究成果讓更多人知道,以及了解自己研究方向的最新進(jìn)展、結(jié)識更多的研究人員。雷鋒網(wǎng) AI 研習(xí)社大講堂就是一個供研究人員們分享自己成果、促進(jìn)廣泛溝通互動的直播平臺。
自 AI 大講堂去年 7 月上線以來, 已經(jīng)有來自清華大學(xué)、北京大學(xué)、上海交通大學(xué)、香港科技大學(xué)、 MIT、UC Berkeley、悉尼科技大學(xué)等知名國內(nèi)外高校的嘉賓進(jìn)行直播分享,甚至還舉辦了線下論文分享會,迄今已完成了 68 期,覆蓋影響讀者過萬人。不僅嘉賓自己的研究成果被直播觀眾以及讀者們了解,也讓科技愛好者們、學(xué)生們、其它研究人員們增進(jìn)了對人工智能相關(guān)思維、知識、應(yīng)用的認(rèn)識,為國內(nèi)人工智能長期持續(xù)發(fā)展的氛圍出一份力。
人工智能相關(guān)的各個研究方向中,最為豐富也最為熱門的當(dāng)屬計算機(jī)視覺(CV)了,其中的熱門任務(wù)包括圖像分類、對象檢測、圖像分割、圖像生成、圖像描述生成等等。下面我們匯總了近期(2018 年以來)9 期精彩的計算機(jī)視覺方向分享回顧。
分享嘉賓:劉漢唐,浙江大學(xué)計算機(jī)系博士生。
圖像分割是計算機(jī)視覺中一個經(jīng)典并且基礎(chǔ)的問題,對于理解圖像非常關(guān)鍵。圖像分割有很多應(yīng)用場景,比如無人駕駛、地圖重建、圖像美化等等。深度學(xué)習(xí)使得圖像分割有了巨大的發(fā)展,本次分享會介紹深度學(xué)習(xí)中圖像分割的經(jīng)典算法。
分享嘉賓:黃靖佳,北京大學(xué)深圳研究生院信息工程學(xué)院二年級博士生。
視頻中的行為檢測是當(dāng)下的熱點研究任務(wù),該任務(wù)要求從一段未經(jīng)修剪的(untrimmed)視頻中找出目標(biāo)行為發(fā)生的時間區(qū)間。由于目標(biāo)行為可能發(fā)生的時間點以及目標(biāo)行為的持續(xù)時間均是不確定的,使得在完成這項任務(wù)時往往需要花費(fèi)大量的計算資源對不同時間尺度(長度),不同起點的視頻片段進(jìn)行判斷。為了避免這種低效的檢測方法,我們提出了一種可以自適應(yīng)調(diào)整檢測窗口大小及位置的方法,對視頻進(jìn)行高效的檢測。
分享嘉賓:何詩怡,北京大學(xué)計算機(jī)視覺碩士,優(yōu)必選悉尼AI研究院學(xué)生。
與單標(biāo)簽圖像分類相比,多標(biāo)簽圖像分類是一種更符合真實世界客觀規(guī)律的方法,尤其在圖像和視頻的語義標(biāo)注,基于內(nèi)容的圖像檢索等領(lǐng)域有著廣泛的應(yīng)用。因此,本次公開課,何詩怡將分享她用強(qiáng)化學(xué)習(xí)解決多標(biāo)簽圖像分類問題的方法和經(jīng)驗
分享嘉賓:王薇月,南加州大學(xué)計算機(jī)系在讀博士。
隨著激光雷達(dá),RGBD相機(jī)等3D傳感器在機(jī)器人,無人駕駛領(lǐng)域的廣泛應(yīng)用,深度學(xué)習(xí)在三維點云數(shù)據(jù)的研究在近兩年取得了廣泛關(guān)注。點云分割、識別、檢測成為學(xué)術(shù)界、工業(yè)界的熱門話題之一。是在本次公開課中,講者將分享其關(guān)于點云分割的最新工作。
分享嘉賓:張宇倫,美國東北大學(xué)計算機(jī)工程在讀博士,Adobe 公司深度學(xué)習(xí)研究實習(xí)生
圖像超分辨率技術(shù)作為底層計算機(jī)視覺任務(wù),有著廣泛的應(yīng)用場景,比如:手機(jī)圖像增強(qiáng),視頻監(jiān)控,醫(yī)療影像,衛(wèi)星圖像,低分辨率人臉識別。因此,圖像超分辨率技術(shù)吸引了眾多來自學(xué)術(shù)界與工業(yè)界的研究興趣。但是,當(dāng)前圖像超分辨率技術(shù)仍然面臨一些難題,比如,對高放大倍數(shù)的圖像超分辨,難以恢復(fù)丟失的細(xì)節(jié);對已經(jīng)恢復(fù)出的細(xì)節(jié),也有著模糊等效應(yīng),其質(zhì)量有待提升。因此,本次公開課,張宇倫同學(xué)設(shè)計一種新的網(wǎng)絡(luò)結(jié)構(gòu),得到更強(qiáng)的表達(dá)能力,不僅將之前方法難以恢復(fù)的細(xì)節(jié)恢復(fù)出來了,而且,結(jié)果更清晰。最終,在不同圖像退化模型下都達(dá)到了當(dāng)前較好的結(jié)果。
分享嘉賓:姜仲石,紐約大學(xué)科朗數(shù)學(xué)研究所(NYU Courant) 二年級博士生。
網(wǎng)格是幾何數(shù)據(jù)的常用高效表示, 在幾何曲面構(gòu)建的機(jī)器學(xué)習(xí)方法對計算機(jī)圖形學(xué),3D計算機(jī)視覺以及幾何分析和處理有著重要的意義。
分享嘉賓:任中正,現(xiàn)UIUC攻讀計算機(jī)博士。
現(xiàn)在的神經(jīng)網(wǎng)絡(luò)可以通過監(jiān)督學(xué)習(xí)學(xué)到很好的遷移學(xué)習(xí)本領(lǐng),然而卻需要百萬級別的手工標(biāo)注數(shù)據(jù)。自監(jiān)督(self-supervised)任務(wù)就是一種為了取代標(biāo)注數(shù)據(jù)的方式。 然而已有的自監(jiān)督方法大部分是單任務(wù),導(dǎo)致模型容易在這個任務(wù)上過擬合。任博士分享了用合成數(shù)據(jù)做多任務(wù)特征學(xué)習(xí)的工作,以及如何使用domain adaptation來讓學(xué)到的特征更好的遷移到真實世界的視覺任務(wù)上。
分享嘉賓:胡梟瑋,香港中文大學(xué)二年級博士生。
陰影檢測是計算機(jī)視覺中基礎(chǔ)并富有挑戰(zhàn)性的問題。檢測陰影區(qū)域,為進(jìn)一步獲取圖像中的光照情況、物體的形狀與位置,以及攝像機(jī)的參數(shù)提供了可能,同時陰影的存在為目標(biāo)的檢測與跟蹤帶來了障礙。檢測陰影區(qū)域需要理解圖像全局的語義信息,本文提出通過方向性地分析圖像空間上下文信息來理解陰影,同時設(shè)計了DSC模型用于檢測、去除陰影,并在兩個陰影檢測數(shù)據(jù)集以及兩個陰影去除數(shù)據(jù)集上都達(dá)到了頂尖的性能。這篇論文已被CVPR 2018收錄,并做口頭報告(Oral)。
分享嘉賓:劉晨,圣路易斯華盛頓大學(xué)計算機(jī)系在讀博士。
隨著增強(qiáng)現(xiàn)實,家務(wù)機(jī)器人等應(yīng)用的普及,室內(nèi)場景重建研究正在得到越來越廣泛的關(guān)注。與傳統(tǒng)底層密集重建方法不同,講者的研究集中在分析重建場景中的高層結(jié)構(gòu)化信息。在本次公開課中,講者將分享其結(jié)構(gòu)化重建的最新工作。
大講堂系列直播分享持續(xù)進(jìn)行中。更多精彩研究成果分享、更多往期內(nèi)容匯總,請繼續(xù)關(guān)注雷鋒網(wǎng)相關(guān)內(nèi)容。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。