技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品

本文作者： Travis

2014-09-09 18:50

導(dǎo)語(yǔ)：ImageNet視覺識(shí)別挑戰(zhàn)是全球最大的計(jì)算機(jī)視覺挑戰(zhàn)。該比賽每年舉辦一次，旨在發(fā)現(xiàn)更好的圖像技術(shù)，尤其是物體識(shí)別和鎖定這兩方面。今年所勝出的團(tuán)隊(duì)來(lái)自于Google，連細(xì)小的物體都能夠準(zhǔn)確識(shí)別出來(lái)。

近日，谷歌通過官方博客，介紹了圖像識(shí)別領(lǐng)域取得的一些重大進(jìn)展。這個(gè)識(shí)別技術(shù)最早是在ImageNet計(jì)算機(jī)視覺挑戰(zhàn)比賽（ILSVRC）上展示。ImageNet視覺識(shí)別挑戰(zhàn)每年舉辦一次，旨在發(fā)現(xiàn)更好的圖像技術(shù)，尤其是物體識(shí)別和鎖定這兩方面。目前主要的參賽者來(lái)自于學(xué)術(shù)機(jī)構(gòu)和實(shí)驗(yàn)室。

在今年的比賽里面，隸屬于Google的GoogLeNet團(tuán)隊(duì)刷新了“分類和偵測(cè)”記錄，其精度比去年的記錄提升了兩倍。目前他們已經(jīng)把這個(gè)項(xiàng)目公開，希望能夠邀請(qǐng)更多人來(lái)參與其中，借此來(lái)加速項(xiàng)目的發(fā)展。

技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品

這個(gè)挑戰(zhàn)遵循三個(gè)步驟：分類、分類并鎖定以及偵測(cè)。分類主要是測(cè)試所選用的算法是否可以正確的給圖片中的物體貼上相應(yīng)的標(biāo)簽。分類并鎖定主要是測(cè)試算法在圖像識(shí)別和鎖定潛在物體上的能力。偵測(cè)和第二個(gè)步驟比較類似，但是這個(gè)環(huán)節(jié)會(huì)使用更加苛刻的評(píng)估標(biāo)準(zhǔn)，所使用的圖像包含了很多非常細(xì)小的物體。在偵測(cè)環(huán)節(jié)中，性能優(yōu)越的圖像識(shí)別技術(shù)是可以在復(fù)雜場(chǎng)景中精準(zhǔn)鎖定和識(shí)別物體的。

技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品

Google的物體識(shí)別圖像技術(shù)涉及到神經(jīng)網(wǎng)絡(luò)技術(shù)和深度學(xué)習(xí)技術(shù)。該系統(tǒng)在無(wú)需龐大計(jì)算資源支撐的背景下，能夠?qū)ψR(shí)別物體的標(biāo)準(zhǔn)進(jìn)行優(yōu)化和微調(diào)，并最終識(shí)別出物體。從谷歌發(fā)布的照片中我們可以看出，目前這項(xiàng)技術(shù)可以識(shí)別出我們常見的物體，比如寵物貓、雞蛋、香蕉、橘子、電視機(jī)、顯示器、書架等。

技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品

這個(gè)技術(shù)目前還處于早期研發(fā)階段，隨著這個(gè)技術(shù)的進(jìn)步與成熟，我們將可以用上更好的圖像識(shí)別技術(shù)。這個(gè)技術(shù)也可以直接對(duì)接到Google旗下的一些產(chǎn)品和服務(wù)，例如圖片搜索、YouTube、自動(dòng)駕駛技術(shù)以及有必要使用圖像識(shí)別技術(shù)的領(lǐng)域。

via googleresearch

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

Travis

編輯

發(fā)私信

當(dāng)月熱門文章

技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品

技高一籌？最新的Google圖片識(shí)別技術(shù)能夠“認(rèn)出”大部分物品