0
本文作者: 高婓 | 2016-09-08 18:06 |
編者按:一年前,F(xiàn)acebook發(fā)布了照片分享應(yīng)用Moments,于前不久關(guān)閉了iOS版Facebook照片同步功能,力推Moments應(yīng)用,該應(yīng)用運(yùn)用了人臉識(shí)別技術(shù)。不過,F(xiàn)acebook人工智能實(shí)驗(yàn)室負(fù)責(zé)人Yann Lecun在為我們通俗易懂地介紹Moments的應(yīng)用原理時(shí)表示,除了簡(jiǎn)單的人臉識(shí)別技術(shù),F(xiàn)acebook將利用更卓越的計(jì)算機(jī)視覺技術(shù)和AI技術(shù)為用戶提供更多便利,如嘗試開發(fā)計(jì)算機(jī)的移情能力,當(dāng)然,這些便利的應(yīng)用背后需要強(qiáng)大的算法和繁瑣的訓(xùn)練過程做支撐。讓我們一起期待未來計(jì)算機(jī)能夠更好地理解人類,使我們的工作、生活更為便捷。
Facebook強(qiáng)力推行的照片分享應(yīng)用Moments通過運(yùn)用圖像識(shí)別技術(shù),使用戶可以掃描朋友的照片創(chuàng)建私人群體相冊(cè)。當(dāng)有六個(gè)人在活動(dòng)現(xiàn)場(chǎng)同時(shí)拍照時(shí),Moments使所有參與者相互之間能夠更為便捷地分享照片,省去了把快照通過郵件發(fā)送給每一個(gè)人,然后再創(chuàng)建相冊(cè)的繁瑣過程。當(dāng)然,這種應(yīng)用并不像發(fā)現(xiàn)治療癌癥的方法一樣,稱得上是“壯舉”,但是,在這種便捷照片分享應(yīng)用背后有著令人印象深刻的技術(shù),F(xiàn)acebook花了幾年的時(shí)間才開發(fā)出這種技術(shù)。
Moments應(yīng)用的關(guān)鍵點(diǎn)在于有Facebook的算法作為支撐,使得這種應(yīng)用能夠在不同的照片中識(shí)別出同一個(gè)人的面容,如此一來,Moments能夠知道有哪些人在活動(dòng)現(xiàn)場(chǎng)。這就要求具備計(jì)算機(jī)視覺專門知識(shí),Google, Microsoft,Baidu及其他公司一直以來都致力于計(jì)算機(jī)視覺領(lǐng)域的研究,其應(yīng)用從自動(dòng)駕駛車輛到傻瓜式網(wǎng)絡(luò)產(chǎn)品,如微軟的“我看起來多大年紀(jì)”應(yīng)用,變化不等。
Moments的發(fā)布代表著Facebook正在與全世界分享其在計(jì)算機(jī)視覺領(lǐng)域研究所取得的成功。Facebook人臉識(shí)別精度能夠達(dá)到98%,識(shí)別速度也是非比尋常,能夠在不到5秒的時(shí)間內(nèi),從8億張照片中識(shí)別出你的照片。最后,即使不能獲得你的正面鏡頭(或者你的臉根本沒有出現(xiàn)在照片中),Momemts都能夠輕松識(shí)別出你的照片,這一切都要?dú)w功于一種機(jī)器學(xué)習(xí)算法,該算法能夠兼顧圖片中與照片數(shù)據(jù)有關(guān)的其他元素內(nèi)容。
Fortune曾經(jīng)采訪過Facebook人工智能實(shí)驗(yàn)室負(fù)責(zé)人Yann LeCun,采訪過程中了解到他的團(tuán)隊(duì)是如何幫助一臺(tái)計(jì)算機(jī)理解“你是誰(shuí)”,及下一步Facebook在AI研究領(lǐng)域?qū)⒂泻涡逻M(jìn)展。在LeCun談?wù)撚?jì)算機(jī)視覺時(shí),也許我們首先要理解:盡管教會(huì)軟件識(shí)別對(duì)象的過程與人看外界事物具有相似之處,我們依然不能將計(jì)算機(jī)視覺簡(jiǎn)單地等同于人看外界事物。
例如,F(xiàn)acebook的人臉識(shí)別技術(shù)不能識(shí)別出你。只有當(dāng)兩張照片中的人是同一個(gè)人時(shí),這種技術(shù)才能夠識(shí)別出被識(shí)別對(duì)象。人臉識(shí)別技術(shù)實(shí)際上是一個(gè)完全分離的步驟。
由于Facebook主要是為了建立人與人之間的密切聯(lián)系,其計(jì)算機(jī)視覺技術(shù)以識(shí)別人臉為側(cè)重點(diǎn),不用于識(shí)別貓,車輛或其他物理實(shí)物。為了實(shí)現(xiàn)這一目的,F(xiàn)acebook采用一個(gè)被稱為“Labeled Faces in the Wild”的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由名人和政客的照片組成。數(shù)據(jù)庫(kù)中含有13000張照片,照片中人們以不同的發(fā)型,不同的服裝,有時(shí)戴眼鏡或其他的裝飾物出現(xiàn)。Facebook使用該圖像集訓(xùn)練其機(jī)器學(xué)習(xí)算法。其他公司也曾使用該數(shù)據(jù)集,一些大學(xué)運(yùn)用該圖像集訓(xùn)練系統(tǒng),識(shí)別精度達(dá)到98%。
因此,Facebook究竟是如何通過給一臺(tái)機(jī)器一張Angelina Jolie的照片,然后,在這張照片的幫助下,使這臺(tái)機(jī)器從不同的相冊(cè)中識(shí)別出你姐姐的呢?LeCun可以為我們解答這一難題。大約20年前,當(dāng)LeCun在貝爾實(shí)驗(yàn)室工作時(shí),他偶然想到應(yīng)該如何教會(huì)計(jì)算機(jī)“看”世界,這種想法直到4年前才在學(xué)術(shù)界之外得到推廣應(yīng)用。
計(jì)算機(jī)視覺所用到的技術(shù)被稱為卷積神經(jīng)網(wǎng)絡(luò),該命名來源于被稱為“回旋”的數(shù)學(xué)操作,并從人類大腦的學(xué)習(xí)原理獲得靈感。人類大腦是通過在神經(jīng)元之間建立聯(lián)系實(shí)現(xiàn)學(xué)習(xí)的,一個(gè)信號(hào)被傳送給神經(jīng)元的頻率越高,神經(jīng)元之間的聯(lián)系越緊密。同理,當(dāng)計(jì)算機(jī)為兩張圖像建立相似度聯(lián)系時(shí),它將為這些相似度分配權(quán)值。在卷積神經(jīng)網(wǎng)絡(luò)中,所設(shè)定的目標(biāo)是訓(xùn)練機(jī)器,使之能夠識(shí)別所建立聯(lián)系之間權(quán)重的變化,以便于計(jì)算機(jī)能夠越來越精確地判斷圖像與圖像之間是否匹配。
這種訓(xùn)練識(shí)別過程是相當(dāng)復(fù)雜的,涉及到不同的計(jì)算方法,運(yùn)用這些計(jì)算方法能夠判斷一幅圖像中哪些特征對(duì)于識(shí)別圖像信息是重要的。例如,如果你想要訓(xùn)練一臺(tái)計(jì)算機(jī)來識(shí)別人臉,圖像背景的像素就顯得并不太重要。令人感到不可思議的是,機(jī)器能夠自行學(xué)習(xí),識(shí)別出圖像種哪些特征是最相關(guān)的,然后對(duì)這些重要特征進(jìn)行歸納總結(jié)。不過,還是需要人為地推動(dòng)計(jì)算機(jī)識(shí)別出合理的方式為相似度賦權(quán)值,一旦建模成功,計(jì)算機(jī)將具備歸納總結(jié)重要特征的能力。
將會(huì)花費(fèi)幾天的時(shí)間在一臺(tái)配置很好的計(jì)算機(jī)上完成這一訓(xùn)練過程。
當(dāng)多倫多大學(xué)Geoffery Hinton教授帶領(lǐng)其研究團(tuán)隊(duì)使用卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別算法競(jìng)賽中獲勝之后,卷積神經(jīng)網(wǎng)絡(luò)幾乎成為所有計(jì)算機(jī)視覺研究的基石。之后,Hinton的研究團(tuán)隊(duì)和其建立的新公司被Google收購(gòu),Hinton以測(cè)試誤差為15.3%在比賽中獲勝,第二名優(yōu)勝者的成績(jī)?yōu)?6.2%。
Facebook的自動(dòng)人臉識(shí)別技術(shù)有助于用戶保護(hù)自己的隱私不受侵犯。例如,當(dāng)自動(dòng)人臉識(shí)別技術(shù)得到廣泛應(yīng)用時(shí),你每上傳到Facebook一張照片都會(huì)及時(shí)獲得通知。例如,假如你不經(jīng)意間出現(xiàn)在一個(gè)游客在時(shí)代廣場(chǎng)拍的照片背景中,你能夠及時(shí)獲得通知,有權(quán)選擇將照片中自己的臉變得模糊,無法識(shí)別。對(duì)于小孩子,如果出現(xiàn)這種情況,F(xiàn)acebook將自動(dòng)開啟模糊或刪除功能。Lecun表示,F(xiàn)acebook對(duì)這類應(yīng)用工具很感興趣,但是,他同時(shí)也強(qiáng)調(diào),F(xiàn)acebook的對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的興趣遠(yuǎn)遠(yuǎn)超過圖像識(shí)別技術(shù)。
Facebook的目標(biāo)是使計(jì)算機(jī)具備移情能力。很明顯,計(jì)算機(jī)不能感知到人們的行為,不過,能夠訓(xùn)練計(jì)算機(jī)使其具備識(shí)別人的情感及人的反應(yīng)的能力。當(dāng)計(jì)算機(jī)的理解能力能夠達(dá)到這種水平式時(shí),當(dāng)你將要上傳自己喝得醉醺醺的照片時(shí),F(xiàn)acebook將會(huì)發(fā)出提示,確認(rèn)你是否真的想要這樣做。
“計(jì)算機(jī)的移情能力遠(yuǎn)遠(yuǎn)超過人臉識(shí)別技術(shù)”,LeCun表示。“我們不關(guān)注誰(shuí)在照片中,我們將運(yùn)用其他類型的圖像識(shí)別技術(shù),通過不同手段訓(xùn)練這些技術(shù), 使計(jì)算機(jī)能夠識(shí)別出——這張照片看起來令人尷尬,提示你是否真的要將照片公之于眾?!?/span>
當(dāng)然,F(xiàn)acebook現(xiàn)階段還不具備開發(fā)出這種圖像識(shí)別技術(shù)的能力,但是LeCun提出這些概念作為實(shí)驗(yàn)構(gòu)想,指明了Facebook人工智能研究未來的發(fā)展方向。當(dāng)然,這種僅用一種算法便可以達(dá)到的圖像識(shí)別技術(shù)著實(shí)會(huì)給人們帶來深深的不安?,F(xiàn)在,由于人們對(duì)于個(gè)人隱私的關(guān)注,F(xiàn)acebook尚未在加拿大及歐盟等國(guó)家推廣這種自動(dòng)標(biāo)記應(yīng)用。要使得一臺(tái)計(jì)算機(jī)能夠在幾秒內(nèi)猜測(cè)出你分享照片的意圖,或者使軟件嘗試著分析你的笑話,并理解你所講笑話中的笑點(diǎn),還要考慮一種潛在變化的影響因素。
“我們的目標(biāo)是使機(jī)器變得更加智能化,能夠理解文本,圖像,視頻及郵件,在數(shù)字化的世界里,我們想要機(jī)器理解事物發(fā)生的場(chǎng)景”,LeCun表示。由于每天都能夠接收到如此多的數(shù)據(jù)內(nèi)容,人們不免感到不知所措。LeCun的研究團(tuán)隊(duì)所做出的努力將幫助人們獲取與其興趣密切相關(guān)的內(nèi)容。要實(shí)現(xiàn)這一簡(jiǎn)單目標(biāo)可能牽涉到復(fù)雜的解決方法:保證你在Facebook上看到自己需要的信息。
“使機(jī)器理解人類,這是Facebook一直嘗試完成的一項(xiàng)重大任務(wù)”,LeCun表示。
本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)允許拒絕轉(zhuǎn)載!·
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。