0
雷鋒網(wǎng)AI科技評論消息:10月29日上午,在意大利威尼斯召開的計(jì)算機(jī)視覺國際頂級會(huì)議 ICCV 2017的 “Joint COCO and Places Recognition Challenge” 專題會(huì)上公布了COCO +Places 2017挑戰(zhàn)賽的排名情況。
COCO and Places Recognition Challenge共包括 COCO Challenge和Places Challenge兩部分。
COCO挑戰(zhàn)賽偏重對物體的理解。COCO Challenge ( Common Objects in Context,常見物體圖像識別挑戰(zhàn)) 和 ImageNet挑戰(zhàn)賽有相似之處,不過與關(guān)注整體圖像的 ImageNet 圖像分類任務(wù)相比,COCO 中的物體檢測任務(wù)更關(guān)注的是場景理解中的物體識別,需要對圖像中出現(xiàn)的每個(gè)物體的個(gè)體(如各種小物體,各種遮擋物體)進(jìn)行識別,因此要求算法對圖像細(xì)節(jié)有更好的理解。
COCO是一個(gè)圖像數(shù)據(jù)集,是用來推動(dòng)物體檢測研究,特別是檢測上下文中的物體。其中提供的注釋包括80個(gè)分類的物體像素級分割,人體實(shí)例的關(guān)鍵點(diǎn)注釋,91個(gè)類別的背景語義分割,每張圖片中5條圖像標(biāo)注。
具體分為四類任務(wù):COCO物體檢測挑戰(zhàn)(Detection Challenge),COCO物體分割挑戰(zhàn)(Segmentation Challenge),COCO關(guān)鍵點(diǎn)挑戰(zhàn)(Keypoint Challenge),COCO背景語義分割挑戰(zhàn)(Stuff Segmentation Challenge )。
COCO物體檢測/分割挑戰(zhàn)
COCO物體檢測\分割有四支參賽隊(duì)伍,曠視科技(face++)奪的物體檢測第一;由北京大學(xué)和香港中文大學(xué)組成的研究團(tuán)隊(duì)(Team UCenter)奪得物體分割挑戰(zhàn)第一。
COCO人體關(guān)鍵點(diǎn)挑戰(zhàn)
鼓勵(lì)團(tuán)隊(duì)參與兩種物體檢測挑戰(zhàn)中的一種(或兩種)競爭:使用包圍盒輸出或?qū)ο蠓指钶敵觥?/p>
人體關(guān)鍵點(diǎn)檢測有兩支參賽隊(duì),曠視科技(face++)奪得第一;第二名由商湯科技(Beihang University & Sense Time)團(tuán)隊(duì)獲得。
COCO背景語義分割挑戰(zhàn)
要求在不受外界控制的條件下,對人體關(guān)鍵點(diǎn)定位。挑戰(zhàn)的難點(diǎn)是同時(shí)檢測人的位置以及定位他們的關(guān)鍵點(diǎn)(測試中不提供人體位置)。鑒于COCO檢測挑戰(zhàn)主要檢測圖片中的“物”(如人,汽車,大象),這個(gè)挑戰(zhàn)的重點(diǎn)放在圖片中的背景(如草,墻,天空)。
“Places挑戰(zhàn)"偏重對場景的理解?!癙laces挑戰(zhàn)"的數(shù)據(jù),是一個(gè)像素級標(biāo)注的圖像數(shù)據(jù)及ADE20K。這個(gè)數(shù)據(jù)集中有2萬張圖像用于訓(xùn)練,2千張用于驗(yàn)證,3千張用于測試。
“Places挑戰(zhàn)”有三項(xiàng)任務(wù):場景解析( scene parsing);實(shí)例分割(instance segmentation);語義邊界檢測(semantic boundary detection)。共有四支隊(duì)伍參加,除了曠視科技,還有以下三支隊(duì)伍:
在場景解析任務(wù)中,冠軍由中科院自動(dòng)化所和京東聯(lián)合建立的CASIA_IVA_JD團(tuán)隊(duì)摘得,第二名是今日頭條的WinterIsComing團(tuán)隊(duì)。
場景解析也叫場景語義分割,是將圖像分割成物體和物類的方法。任務(wù)是在Pascal上像素的分類,類似語義分割任務(wù),但不同的是,要把每一個(gè)測試圖像的每個(gè)像素分若干語義范疇概念,“填充對象”如天空,草地,道路或離散對象,如人,車,建筑。共有150個(gè)語義類別,占所有圖像像素的89%。具體來說,挑戰(zhàn)數(shù)據(jù)分為訓(xùn)練兩萬張圖像,兩千張圖像進(jìn)行驗(yàn)證,和三千張圖像測試。對于每個(gè)圖像,分割算法將產(chǎn)生一個(gè)語義分割掩模,預(yù)測圖像中每個(gè)像素的語義類別。算法性能將根據(jù)在這150個(gè)語義類別中的像素精度平均值來評定。
在實(shí)例分割任務(wù)中,冠軍由曠視科技(face++)摘得,第二名為G-RMI (Google Research and Machine Intelligence)谷歌團(tuán)隊(duì)獲得。
場景實(shí)例分割是將圖像分割為物體實(shí)例。該任務(wù)是類似于任務(wù)1的像素級分類,但它也要求該算法從圖像中提取每個(gè)物體實(shí)例。這項(xiàng)工作的動(dòng)機(jī)有兩個(gè)方面:1)將語義分割的研究推向?qū)嵗指睢?)讓物體檢測、語義分割和場景分析之間有更多的協(xié)同作用。語義類別會(huì)和任務(wù)1中共享數(shù)據(jù),但有100類對象實(shí)例注釋。評價(jià)指標(biāo)是所有100個(gè)語義類別的平均精度(AP)。
語義邊界檢測是檢測圖像中每一個(gè)物體實(shí)例的邊界。邊界檢測與邊緣檢測有關(guān),但更多地關(guān)注邊界及物體實(shí)例的關(guān)聯(lián)。以前在ade20k數(shù)據(jù)圖像的所有像素的注釋對象實(shí)例可以作為語義邊界檢測的基準(zhǔn),這是比以前更大的bsds500。此任務(wù)的數(shù)據(jù)與任務(wù)1和任務(wù)2中使用的圖像相同,共有150個(gè)語義類別。提交的模型將在優(yōu)化數(shù)據(jù)規(guī)模使用F-measure評價(jià)(f-ods)。
雷鋒網(wǎng)AI科技評論小結(jié):繼ImageNet之后,計(jì)算機(jī)視覺領(lǐng)域最具有含金量的挑戰(zhàn)賽COCO +Places 2017幾乎又被華人拿下所有最高獎(jiǎng)。其中表現(xiàn)最為出色當(dāng)屬中國的幾家AI企業(yè),將國際巨頭微軟,谷歌,F(xiàn)acebook都甩在了后面。雷鋒網(wǎng)為中國科技業(yè)取得的成績感到無比驕傲,也祝愿中國AI技術(shù)今后能持續(xù)領(lǐng)跑全球。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。