0
本文作者: 黃善清 | 2018-10-30 16:17 |
雷鋒網(wǎng)AI科技評(píng)論按:10月18日,騰訊 AI Lab 宣布正式開源「Tencent ML-Images」項(xiàng)目,該項(xiàng)目由多標(biāo)簽圖像數(shù)據(jù)集 ML-Images,以及業(yè)內(nèi)目前同類深度學(xué)習(xí)模型中精度最高的深度殘差網(wǎng)絡(luò) ResNet-101 構(gòu)成。
項(xiàng)目訪問地址:
據(jù)雷鋒網(wǎng) AI 科技評(píng)論了解,騰訊 AI Lab 此次公布的圖像數(shù)據(jù)集 ML-Images,包含了 1800 萬(wàn)圖像和 1.1 萬(wàn)多種常見物體類別,在業(yè)內(nèi)已公開的多標(biāo)簽圖像數(shù)據(jù)集中規(guī)模最大,足以滿足一般科研機(jī)構(gòu)及中小企業(yè)的使用場(chǎng)景。此外,基于 ML-Images 訓(xùn)練得到的深度殘差網(wǎng)絡(luò) ResNet-101,具有優(yōu)異的視覺表示能力和泛化性能,在當(dāng)前業(yè)內(nèi)同類模型中精度最高,將為包括圖像、視頻等在內(nèi)的視覺任務(wù)提供強(qiáng)大支撐,并助力圖像分類、物體檢測(cè)、物體跟蹤、語(yǔ)義分割等技術(shù)水平的提升。
本次正式開源,其主要內(nèi)容包括:
ML-Images 數(shù)據(jù)集的全部圖像 URLs, 以及相應(yīng)的類別標(biāo)注。因原始圖像版權(quán)問題,此次開源將不直接提供原始圖像,用戶可利用騰訊 AI Lab 提供的下載代碼和 URLs 自行下載圖像。
ML-Images 數(shù)據(jù)集的詳細(xì)介紹。包括圖像來源、圖像數(shù)量、類別數(shù)量、類別的語(yǔ)義標(biāo)簽體系、標(biāo)注方法,以及圖像的標(biāo)注數(shù)量等統(tǒng)計(jì)量。
完整的代碼和模型。騰訊 AI Lab 提供的代碼涵蓋從圖像下載和圖像預(yù)處理,到基于 ML-Images 的預(yù)訓(xùn)練和基于 ImageNet 的遷移學(xué)習(xí),再到基于訓(xùn)練所得模型的圖像特征提取的完整流程。項(xiàng)目提供了基于小數(shù)據(jù)集的訓(xùn)練示例,以方便用戶快速體驗(yàn)該訓(xùn)練流程。項(xiàng)目還提供了具有極高精度的 ResNet-101 模型 (在單標(biāo)簽基準(zhǔn)數(shù)據(jù)集 ImageNet 的驗(yàn)證集上的 top-1 精度為 80.73%)。用戶可根據(jù)自身需求,隨意選用該項(xiàng)目的代碼或模型。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。