1
本文作者: 三川 | 2017-07-13 16:30 |
雷鋒網(wǎng)消息,微軟發(fā)布了一款基于計(jì)算機(jī)視覺(jué)技術(shù)的手機(jī) APP “Seeing AI”(“視覺(jué) AI”) ,能為有視力缺陷的殘障人士描述周圍的世界。
安裝該 APP 之后,用戶若把手機(jī)攝像頭對(duì)準(zhǔn)某人,它就會(huì)說(shuō)出這個(gè)人是誰(shuí),以及他的情緒(表情)。把手機(jī)攝像頭對(duì)準(zhǔn)某個(gè)物體,Seeing AI 會(huì)說(shuō)出這是個(gè)什么東西。這通過(guò)在手機(jī)本地運(yùn)行的 AI 算法實(shí)現(xiàn)。
Seeing AI 人臉識(shí)別示例:“戴著眼鏡的 28 歲女士,看起來(lái)很開(kāi)心?!?/span>
去年三月的 Build 大會(huì)上,微軟展示了這款 APP 的原型。今天,它終于發(fā)布。美國(guó) iOS 用戶已可免費(fèi)下載。至于 Seeing AI 何時(shí)會(huì)登陸安卓、進(jìn)入中國(guó)市場(chǎng),雷鋒網(wǎng)尚沒(méi)收到任何消息。
作為一款面向殘障人士的生活輔助軟件,微軟把 Seeing AI 設(shè)計(jì)為能滿足一系列不同的生活場(chǎng)景需求。比如上面提到的,進(jìn)行面部識(shí)別,猜測(cè)對(duì)方的年齡和情緒。它還能通過(guò)掃描二維碼識(shí)別家居物品,讀取、識(shí)別文件,識(shí)別美元鈔票。識(shí)別鈔票的功能是一個(gè)實(shí)用性極強(qiáng)的功能。所有美元紙幣都是相同大小、同樣顏色。對(duì)部分殘障人士,區(qū)分不同面值的鈔票可能會(huì)十分困難,Seeing AI 這樣的 APP 則能解決該問(wèn)題。
Seeing AI 文件識(shí)別示例
Seeing AI 的物體識(shí)別能力基于神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn),其基本原理與自動(dòng)駕駛汽車、無(wú)人機(jī)并無(wú)不同。它最基本的功能在本地實(shí)現(xiàn)。這有兩個(gè)好處:
網(wǎng)絡(luò)不穩(wěn)定的情況下仍可使用;
反饋速度更快。
但是,Seeing AI 的試驗(yàn)性功能,比如描述整個(gè)周圍環(huán)境,以及識(shí)別手寫文字,則需要連接到云端。
Seeing AI 的技術(shù)帶頭人 Saqib Shaikh,向媒體透露了一個(gè)很有意思的細(xì)節(jié):
Seeing AI 能夠指示用戶如何上下左右移動(dòng)手機(jī)攝像頭,以看清楚目標(biāo)物體。 這是一個(gè)相當(dāng)人性化的功能,尤其考慮到視力有缺陷的殘障用戶,讓它們拿手機(jī)攝像頭“對(duì)準(zhǔn)”某個(gè)物體本身就存在相當(dāng)?shù)碾y度。很顯然,對(duì)于 Seeing AI 來(lái)講,雖然光學(xué)物體識(shí)別技術(shù)是根本,但若沒(méi)有這類人性化功能設(shè)計(jì),它究竟有多少實(shí)用價(jià)值就變得十分模糊。
Saqib Shaikh
從 Saqib Shaikh 他自己的使用經(jīng)歷來(lái)講(他是一名盲人),他最經(jīng)常把 Seeing AI 用來(lái)識(shí)別符號(hào)和菜單。至于 Seeing AI 和其他同類 APP 之間的差異,他表示,最大的區(qū)別神經(jīng)網(wǎng)絡(luò)的運(yùn)行速度:
“我們做到了在本地運(yùn)行人臉識(shí)別,幾微秒的時(shí)間內(nèi)你就能聽(tīng)到結(jié)果。速度就是一切,我們?cè)噲D壓榨出在設(shè)備本地所能達(dá)到的極限?!?/p>
via the verge,雷鋒網(wǎng)編譯
相關(guān)文章:
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。