0
| 本文作者: 黃善清 | 2018-10-30 16:17 |
雷鋒網AI科技評論按:10月18日,騰訊 AI Lab 宣布正式開源「Tencent ML-Images」項目,該項目由多標簽圖像數據集 ML-Images,以及業(yè)內目前同類深度學習模型中精度最高的深度殘差網絡 ResNet-101 構成。
項目訪問地址:
據雷鋒網 AI 科技評論了解,騰訊 AI Lab 此次公布的圖像數據集 ML-Images,包含了 1800 萬圖像和 1.1 萬多種常見物體類別,在業(yè)內已公開的多標簽圖像數據集中規(guī)模最大,足以滿足一般科研機構及中小企業(yè)的使用場景。此外,基于 ML-Images 訓練得到的深度殘差網絡 ResNet-101,具有優(yōu)異的視覺表示能力和泛化性能,在當前業(yè)內同類模型中精度最高,將為包括圖像、視頻等在內的視覺任務提供強大支撐,并助力圖像分類、物體檢測、物體跟蹤、語義分割等技術水平的提升。
本次正式開源,其主要內容包括:
ML-Images 數據集的全部圖像 URLs, 以及相應的類別標注。因原始圖像版權問題,此次開源將不直接提供原始圖像,用戶可利用騰訊 AI Lab 提供的下載代碼和 URLs 自行下載圖像。
ML-Images 數據集的詳細介紹。包括圖像來源、圖像數量、類別數量、類別的語義標簽體系、標注方法,以及圖像的標注數量等統(tǒng)計量。
完整的代碼和模型。騰訊 AI Lab 提供的代碼涵蓋從圖像下載和圖像預處理,到基于 ML-Images 的預訓練和基于 ImageNet 的遷移學習,再到基于訓練所得模型的圖像特征提取的完整流程。項目提供了基于小數據集的訓練示例,以方便用戶快速體驗該訓練流程。項目還提供了具有極高精度的 ResNet-101 模型 (在單標簽基準數據集 ImageNet 的驗證集上的 top-1 精度為 80.73%)。用戶可根據自身需求,隨意選用該項目的代碼或模型。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。