騰訊 AI Lab 正式開源業(yè)內最大規(guī)模多標簽圖像數據集

本文作者：黃善清

2018-10-30 16:17

導語：本文將介紹「Tencent ML-Images」項目正式開源情況。

騰訊AI Lab

AI影響因子

開發(fā)

企業(yè)：騰訊

操作：開源數據集

內容：多標簽圖像數據集

雷鋒網AI科技評論按：10月18日，騰訊 AI Lab 宣布正式開源「Tencent ML-Images」項目，該項目由多標簽圖像數據集 ML-Images，以及業(yè)內目前同類深度學習模型中精度最高的深度殘差網絡 ResNet-101 構成。

項目訪問地址:

https://github.com/Tencent/tencent-ml-images

據雷鋒網 AI 科技評論了解，騰訊 AI Lab 此次公布的圖像數據集 ML-Images，包含了 1800 萬圖像和 1.1 萬多種常見物體類別，在業(yè)內已公開的多標簽圖像數據集中規(guī)模最大，足以滿足一般科研機構及中小企業(yè)的使用場景。此外，基于 ML-Images 訓練得到的深度殘差網絡 ResNet-101，具有優(yōu)異的視覺表示能力和泛化性能，在當前業(yè)內同類模型中精度最高，將為包括圖像、視頻等在內的視覺任務提供強大支撐，并助力圖像分類、物體檢測、物體跟蹤、語義分割等技術水平的提升。

本次正式開源，其主要內容包括：

ML-Images 數據集的全部圖像 URLs, 以及相應的類別標注。因原始圖像版權問題，此次開源將不直接提供原始圖像，用戶可利用騰訊 AI Lab 提供的下載代碼和 URLs 自行下載圖像。
ML-Images 數據集的詳細介紹。包括圖像來源、圖像數量、類別數量、類別的語義標簽體系、標注方法，以及圖像的標注數量等統(tǒng)計量。
完整的代碼和模型。騰訊 AI Lab 提供的代碼涵蓋從圖像下載和圖像預處理，到基于 ML-Images 的預訓練和基于 ImageNet 的遷移學習，再到基于訓練所得模型的圖像特征提取的完整流程。項目提供了基于小數據集的訓練示例，以方便用戶快速體驗該訓練流程。項目還提供了具有極高精度的 ResNet-101 模型 (在單標簽基準數據集 ImageNet 的驗證集上的 top-1 精度為 80.73%)。用戶可根據自身需求，隨意選用該項目的代碼或模型。

雷峰網原創(chuàng)文章，未經授權禁止轉載。詳情見轉載須知。

3人收藏

黃善清

編輯

發(fā)私信

當月熱門文章