1
今日,全球最為權威的計算機視覺大賽 ImageNet ILSVRC2016(大規(guī)模圖像識別競賽)公布了算法排名結果,中國學術界和工業(yè)界團隊包攬多項冠軍。
今年 ILSVRC2016 分為五大部分,包括:目標檢測、目標定位、視頻中目標物體檢測、場景分類、場景分析。中國團隊的成績如下:
CUImage(商湯科技和港中文)目標檢測第一
Trimps-Soushen(公安部三所)目標定位第一
CUvideo(商湯和港中文):視頻中物體檢測子項目第一
NUIST(南京信息工程大學):視頻中的物體探測兩個子項目第一
HikVision(??低暎簣鼍胺诸惖谝?/p>
SenseCUSceneParsing(商湯和港中文):場景分析第一
任務 1a:用提供的數(shù)據(jù)進行目標檢測
CUImage(商湯科技和港中文) 使用提供數(shù)據(jù)合成 6 個模型,檢測物體勝出種類數(shù)量 109,檢測準確率為 0.662751。
任務1b:使用附加訓練數(shù)據(jù)進行目標檢測
CUImage(商湯科技和港中文)采用帶標注的 ImageNet Det 數(shù)據(jù)作為訓練數(shù)據(jù)。識別物體勝出種類數(shù)量 176 個,平均精準度 0.66081。
任務 2a:基于給定數(shù)據(jù)進行分類+定位
第一名 Trimps-Soushen(公安部三所)的模型定位錯誤率為 0.077087,分類錯誤率為 0.02991。
任務 2b:使用附加訓練數(shù)據(jù)進行分類和定位結果
Trimps-Soushen(公安部三所) 在定位和分類上位列第一。
任務 3a:基于給定訓練數(shù)據(jù)進行的視頻中的目標物體檢測
NUIST(南京信息工程大學),識別物體勝出種類數(shù)量 10 個,平均精準度 0.808292。
任務3b:使用附加訓練數(shù)據(jù)進行的視頻中的目標物體檢測
NUIST(南京信息工程大學)識別物體勝出種類數(shù)量為 17 個,平均精準度 0.79593。
任務3c:給定訓練數(shù)據(jù)進行的視頻中物體檢測和追蹤
CUVideo(商湯科技和港中文) 采用基于多模型集成的方法在該項目獲得第一名。
任務 3d:附加訓練數(shù)據(jù)進行的視頻中目標物體檢測和追蹤
NUIST(南京信息工程大學) 提出的基于級聯(lián)區(qū)域回歸和跟蹤的方法在改項目獲得第一。
Hikvision(??低暎┨崛〉哪P驮谠擁椖颗琶谝?。
SenseCUSceneParsing(商湯科技和港中文)提出的環(huán)境語義分割框架獲得該項目第一。
近兩個月,國內團隊先后在全球最權威的人臉檢測評測平臺 FDDB 和全球自動駕駛算法公開排行榜 KITTI 以及 Cityscapes 上取得非常好的成績,這在一定程度上證明了國內計算機視覺相關算法已達到國際頂尖水平。
人臉識別
上個月 FDDB 公開兩組數(shù)據(jù)集排名,一個是研究團隊公開人臉檢測方法的評測組,另一個則不公開方法的評測組。其中小米在公開監(jiān)測方法組里面拿到了世界第一的好成績,而在不公開方法的評測組中,中國公司搶占了整個榜單的半壁江山。
此外,近些年中國公司在人臉關鍵點定位 300-W Benchmark 和 LFW 人臉識別數(shù)據(jù)庫上,也多次包攬世界第一。
自動駕駛
在自動駕駛算法排行榜上,上周國內初創(chuàng)公司圖森互聯(lián)在全球最權威的自動駕駛算法公開排行榜 KITTI 和 Cityscapes 評測數(shù)據(jù)集上均獲得世界第一。在 KITTI 數(shù)據(jù)集中,圖森互聯(lián)獲得目標檢測三個單項、目標追蹤兩個單項、道路分割四個單項,共計九個單項的世界第一。
從現(xiàn)在的勢頭來看,可以預見接下來國內團隊將會陸續(xù)在 ImageNet 等國際人工智能榜單中取得非常好的名次。
那么計算機視覺公司如何在 ImageNet 比賽中獲得冠軍?
9 月 27 日下午 3:00 ,雷鋒網(wǎng)硬創(chuàng)公開課邀請本次ImageNet 大賽中在場景分類中榮獲第一名的杭州海康威視的首席科學家 、??低曆芯吭撼崭痹洪L浦世亮為大家公開講述他們是如何刷爆 ImageNet 的。敬請期待!
掃描二維碼,參與公開課主題分享
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。