1
本文作者: Travis | 2014-09-09 18:50 |
近日,谷歌通過官方博客,介紹了圖像識別領(lǐng)域取得的一些重大進(jìn)展。這個(gè)識別技術(shù)最早是在ImageNet計(jì)算機(jī)視覺挑戰(zhàn)比賽(ILSVRC)上展示。ImageNet視覺識別挑戰(zhàn)每年舉辦一次,旨在發(fā)現(xiàn)更好的圖像技術(shù),尤其是物體識別和鎖定這兩方面。目前主要的參賽者來自于學(xué)術(shù)機(jī)構(gòu)和實(shí)驗(yàn)室。
在今年的比賽里面,隸屬于Google的GoogLeNet團(tuán)隊(duì)刷新了“分類和偵測”記錄,其精度比去年的記錄提升了兩倍。目前他們已經(jīng)把這個(gè)項(xiàng)目公開,希望能夠邀請更多人來參與其中,借此來加速項(xiàng)目的發(fā)展。
這個(gè)挑戰(zhàn)遵循三個(gè)步驟:分類、分類并鎖定以及偵測。分類主要是測試所選用的算法是否可以正確的給圖片中的物體貼上相應(yīng)的標(biāo)簽。分類并鎖定主要是測試算法在圖像識別和鎖定潛在物體上的能力。偵測和第二個(gè)步驟比較類似,但是這個(gè)環(huán)節(jié)會使用更加苛刻的評估標(biāo)準(zhǔn),所使用的圖像包含了很多非常細(xì)小的物體。在偵測環(huán)節(jié)中,性能優(yōu)越的圖像識別技術(shù)是可以在復(fù)雜場景中精準(zhǔn)鎖定和識別物體的。
Google的物體識別圖像技術(shù)涉及到神經(jīng)網(wǎng)絡(luò)技術(shù)和深度學(xué)習(xí)技術(shù)。該系統(tǒng)在無需龐大計(jì)算資源支撐的背景下,能夠?qū)ψR別物體的標(biāo)準(zhǔn)進(jìn)行優(yōu)化和微調(diào),并最終識別出物體。從谷歌發(fā)布的照片中我們可以看出,目前這項(xiàng)技術(shù)可以識別出我們常見的物體,比如寵物貓、雞蛋、香蕉、橘子、電視機(jī)、顯示器、書架等。
這個(gè)技術(shù)目前還處于早期研發(fā)階段,隨著這個(gè)技術(shù)的進(jìn)步與成熟,我們將可以用上更好的圖像識別技術(shù)。這個(gè)技術(shù)也可以直接對接到Google旗下的一些產(chǎn)品和服務(wù),例如圖片搜索、YouTube、自動駕駛技術(shù)以及有必要使用圖像識別技術(shù)的領(lǐng)域。
via googleresearch
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。