4
本文作者: 宮雅卓 | 2015-10-28 14:16 |
【編者按】宮雅卓,聚虹光電創(chuàng)始人,上海交大博士,主攻生物識(shí)別領(lǐng)域,尤其在虹膜識(shí)別領(lǐng)域有15年的專研。本文是宮老師受邀為雷鋒網(wǎng)獨(dú)家分析,有興趣可移步其微信公眾號(hào):jh-irisian。
(庭審現(xiàn)場(chǎng),原被告雙方都由代理律師出庭。法院供圖)
人臉識(shí)別在科技圈熱門(mén)已久,支付寶的人臉支付、微軟辨別年齡的網(wǎng)站How-Old.net、周鴻祎奇酷手機(jī)的人臉識(shí)別……最近,趙薇的老公黃有龍被告上法庭,原因竟是其司機(jī)靳某騙過(guò)公證處的人臉識(shí)別系統(tǒng),以委托人的身份賣掉了趙薇家一處千萬(wàn)的豪宅,而整個(gè)過(guò)程黃有龍并不知情,是遭人“冒充”。這條新聞,讓“人臉識(shí)別”也登上了娛樂(lè)版的頭條。人臉識(shí)別的準(zhǔn)確性和安全性,再次成為大家熱議的焦點(diǎn)。
99%的識(shí)別率如何實(shí)現(xiàn)?
2014年7月,香港中文大學(xué)湯曉鷗教授的三個(gè)人臉識(shí)別算法分別占據(jù)了全球最具權(quán)威的人臉識(shí)別數(shù)據(jù)庫(kù)LFW(Labeled Faces in the Wild)的前三名,其中DeepID2更是以99.15%的識(shí)別率高居榜首。人臉識(shí)別率突破99%的大關(guān),一時(shí)間成為業(yè)界討論的熱點(diǎn)。
(LFW:人臉識(shí)別準(zhǔn)確率最高的六家公司 2014.7)
不過(guò),這一世界記錄現(xiàn)在已被百度打破。在人臉識(shí)別技術(shù)領(lǐng)域兩個(gè)最具權(quán)威的國(guó)際評(píng)測(cè)平臺(tái)FDDB與LFW中,百度都獲得了第一名,領(lǐng)先于國(guó)內(nèi)同行。
(LFW:人臉識(shí)別系統(tǒng)的平均精度和誤差 2015.10)
LFW全部人臉系統(tǒng)檢測(cè)結(jié)果可以參看這里
這似乎意味著,人臉識(shí)別的準(zhǔn)確率超越了99%,識(shí)別精度趨于完美。
如果人臉識(shí)別的準(zhǔn)確率真有那么高,那司機(jī)冒充黃有龍通過(guò)人臉識(shí)別的案件也就不會(huì)發(fā)生了。
而人臉識(shí)別如此高的準(zhǔn)確率又是如何測(cè)評(píng)出來(lái)的呢?
目前國(guó)際上有兩套最為常用的人臉評(píng)測(cè)數(shù)據(jù)集,人臉檢測(cè)數(shù)據(jù)集FDDB和無(wú)約束人臉識(shí)別LFW。
FDDB(Face Detection Data Set and Benchmark)是由馬薩諸塞大學(xué)計(jì)算機(jī)系維護(hù)的一套公開(kāi)數(shù)據(jù)庫(kù),能為來(lái)自全世界的人臉識(shí)別研究者,提供一個(gè)標(biāo)準(zhǔn)的人臉檢測(cè)評(píng)測(cè)平臺(tái)。它使用5171張自然環(huán)境下各種姿態(tài)的人臉照片,從中選取2845張圖片作為測(cè)試集,根據(jù)人臉檢測(cè)準(zhǔn)確率召回率曲線圖得出最終結(jié)論。如下圖所示,橫軸表示誤檢人臉數(shù),縱軸表示檢出率。曲線越陡峭,曲線上的點(diǎn)越接近(0,1),表示檢測(cè)器性能越好。
(FDDB:人臉檢測(cè)準(zhǔn)確率召回率曲線圖 2014.11)
LFW(Labeled Faces in the Wild)則由美國(guó)馬薩諸塞大學(xué)阿默斯特分校進(jìn)行維護(hù)。它從雅虎上提取6000張表情、光線、方向各不相同的人臉照片,考察各個(gè)深度學(xué)習(xí)系統(tǒng)的人臉識(shí)別能力。LFW好比一個(gè)題庫(kù),各個(gè)前來(lái)跑分的人臉識(shí)別系統(tǒng)則是參加考試的學(xué)生。測(cè)試中,LFW給出一對(duì)照片,讓人臉識(shí)別系統(tǒng)判斷兩張照片是不是同一個(gè)人,并給出“是”或“否”的答案。99%的準(zhǔn)確率,意味著該人臉識(shí)別系統(tǒng)在提供的所有題目中答對(duì)了99%。
無(wú)論是LFW,還是FDDB,都只是一個(gè)實(shí)驗(yàn)室級(jí)別、學(xué)術(shù)性質(zhì)的測(cè)試工具。在千人樣本量下,人臉識(shí)別系統(tǒng)的確能取得99%的準(zhǔn)確率。然而,在樣本量可能達(dá)到十萬(wàn)級(jí)、百萬(wàn)級(jí)的實(shí)際商業(yè)場(chǎng)景的應(yīng)用下,在數(shù)據(jù)庫(kù)評(píng)測(cè)時(shí)取得了高準(zhǔn)確率的系統(tǒng),并不一定能復(fù)制同樣的成功,其誤識(shí)率將直線上升,甚至有可能根本沒(méi)法用。在真實(shí)復(fù)雜場(chǎng)景的測(cè)試中,十萬(wàn)分之一的誤識(shí)率下,人臉識(shí)別98%的準(zhǔn)確率甚至?xí)本€下降到70%左右。
人臉識(shí)別在實(shí)際應(yīng)用中的重重障礙之一:相似性
人臉識(shí)別技術(shù)其實(shí)被高估了,它遠(yuǎn)遠(yuǎn)達(dá)不到指紋或虹膜等生物識(shí)別技術(shù)那么高的準(zhǔn)確度。在人臉識(shí)別系統(tǒng)中,對(duì)相似度高的臉容易出現(xiàn)識(shí)別誤差。不說(shuō)雙胞胎了,人臉識(shí)別系統(tǒng)能分得清王珞丹和白百合嗎?(想要知道區(qū)分方法或想要測(cè)試一下,可以點(diǎn)這里看看。
人臉識(shí)別在實(shí)際應(yīng)用中的重重障礙之二:不穩(wěn)定性
趙薇老公的案件中,該公證處采用的人臉識(shí)別系統(tǒng),參照的是黃有龍第二代身份證照片。撇開(kāi)法院判決司機(jī)靳某和黃有龍照片分值超過(guò)0.6不談,照片本身的時(shí)效性也是一個(gè)問(wèn)題。我國(guó)身份證要求20年更換一次照片,但是20歲和40歲的你,恐怕沒(méi)那么相同。
出演《泰坦尼克號(hào)》時(shí)萊昂納多·迪卡普里奧剛剛20歲,他在影片中俊美的扮相讓人印象深刻。而如今二十多年過(guò)去,萊昂納多邁入中年,他的面部輪廓也發(fā)生了改變,下巴也留了胡子。乍看之下,判若兩人。
(萊昂納多·迪卡普里奧:年輕與中年的照片對(duì)比)
年齡是影響人臉識(shí)別的重要因素。皮膚無(wú)可避免地會(huì)松弛、衰老,就算是絕色美人,年老后的臉蛋線條也會(huì)發(fā)生不可逆的變化。而且,人的面貌可以輕易地通過(guò)化妝改變。一位年輕的女性,精心裝扮后的面部和身份證上的照片也許很不一樣。此外,識(shí)別時(shí)所必須的光線,增加了用戶的使用成本。因此,光線、化妝、年齡都會(huì)影響一個(gè)人的面部特征及其識(shí)別準(zhǔn)確性。
人臉識(shí)別在實(shí)際應(yīng)用中的重重障礙之三:可復(fù)制性
人臉識(shí)別無(wú)需用戶配合便能采集到照片,幾乎毫無(wú)困難。這讓人臉成為有“最高易用性”的生物特征。然而,隨之而來(lái)的風(fēng)險(xiǎn)同樣不容小覷。
人臉每天都暴露在外,通過(guò)拍照完全可以獲取一個(gè)人的面部特征,直接用照片或者通過(guò)3D打印復(fù)制人臉便能欺騙攝像頭,進(jìn)行盜竊。
除了人臉的平面照片,動(dòng)態(tài)的人臉視頻也很容易盜取。
近日,一則“最新詐騙”在朋友圈瘋傳。詐騙者以免費(fèi)領(lǐng)一壺油或一個(gè)充電寶為名,讓受騙人掃描二維碼關(guān)注微信,填寫(xiě)身份證號(hào)和手機(jī)號(hào),還要錄制受騙人點(diǎn)頭視頻。受騙者以為得到了免費(fèi)的午餐,卻不知道他們的個(gè)人信息和點(diǎn)頭視頻會(huì)被用犯罪分子用來(lái)開(kāi)戶貸款。
盡管這則消息的真實(shí)性還有待商榷,但卻無(wú)意中指出了人臉識(shí)別的風(fēng)險(xiǎn)。人臉雖然很方便,但涉及到財(cái)產(chǎn)和支付問(wèn)題,還是應(yīng)該謹(jǐn)慎對(duì)待。
在上述人臉識(shí)別的三個(gè)漏洞中,相似性其實(shí)是由人臉自身的特征決定的。人臉的特征點(diǎn)最少為5個(gè),最多也不過(guò)25個(gè)。同為生物特征識(shí)別,指紋的特征點(diǎn)大約在50個(gè)左右。而虹膜的特征點(diǎn)則可達(dá)244個(gè)獨(dú)立的自由維度,是目前世界上最精確的生物識(shí)別技術(shù)。
穩(wěn)定性雖然取決于外部環(huán)境,同時(shí)也受年齡影響。就如面部在不同的年齡階段會(huì)呈現(xiàn)不同的面貌,像 “鄉(xiāng)音無(wú)改鬢毛衰”。暴露在外的身體特征如指紋,會(huì)出現(xiàn)干燥、剝皮、皺褶等現(xiàn)象,這時(shí)候就需要重新注冊(cè)或使用替代方案了。虹膜是人體唯一暴露在外的內(nèi)部器官,和手指與面部不同的是,不會(huì)被環(huán)境與年齡影響。
獨(dú)特性決定了一種生物特征是否準(zhǔn)確,穩(wěn)定性則決定了這種特征能否被用作生物識(shí)別使用。不過(guò),任何一種生物識(shí)別系統(tǒng)最不容忽視的問(wèn)題,是可復(fù)制性。
在眾多欺騙手段中,假體欺騙的問(wèn)題最嚴(yán)重。使用照片、視頻可以騙過(guò)人臉系統(tǒng);購(gòu)買指紋套、利用高清晰的指紋照片倒模,可以瞞過(guò)指紋檢測(cè)。只要是外部特征,幾乎都存在被盜取的風(fēng)險(xiǎn)。如果想要安全與方便兼得,不妨嘗試些其他的生物特征。
至少,在趙薇老公的房產(chǎn)案中,公證處識(shí)別率為98.3%的人臉識(shí)別系統(tǒng)都出了錯(cuò),我是不敢用人臉識(shí)別了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。