3
孩子丟了,一定是整個家庭的噩夢。
我們最大的幸福莫過于擁有一個團團圓圓的家。但世界上,卻有太多因為兒童丟失而破碎的家庭。
看完講述找尋失蹤兒童的現(xiàn)實題材電影《親愛的》,片中人物跑遍大半個中國的尋子故事讓人觸動,但我們還遠不能體會那種丟失孩子帶來的巨大疼痛感與絕望感。
除了片中的田文軍和魯曉娟,現(xiàn)實生活中,每天都在發(fā)生這樣的事。相關(guān)數(shù)據(jù)統(tǒng)計,中國每年的失蹤兒童大約有7萬人,而能夠找回來的大概只占5%。
當人們對此類事件束手無策時,AI的出現(xiàn)就像是橫空出世的英雄,讓那些丟失了孩子的家庭得到一絲慰藉和依托。
技術(shù)從來都不是高冷的,因為技術(shù)往往可以由冰冷生澀的程序代碼轉(zhuǎn)化成極富魔力的溫度;“技術(shù)”也從來不是無用的,除了下圍棋,科技互聯(lián)網(wǎng)企業(yè)正在努力用AI改變最普通人的生活。
今年的兩會上,李彥宏就給出提案,建議用AI和大數(shù)據(jù)技術(shù)幫助尋找丟失兒童。
而這份提案很快就有了一些突破,在不久前“最強大腦”的舞臺上,百度人工智能機器人“小度”對一組幼童照片進行數(shù)據(jù)分析后,成功識別出來到現(xiàn)場的20年后的成年人,在這個過程中,百度共展示了三個維度的AI技術(shù),包含圖像檢索、人臉跨年齡識別和人臉跨代識別。
雷鋒網(wǎng)了解到,除了在“舞臺”上,百度利用此技術(shù)已經(jīng)讓6歲被拐的付貴在丟失了27年之后成功找到了親人。
付貴于1984年在重慶出生,1990年10月16日于重慶市石柱縣大歇鎮(zhèn)丟失,后被拐到福建。今年3月,百度將人工智能的跨年齡人臉識別技術(shù)應(yīng)用于尋找走失兒童中,超過6萬條尋親圖片數(shù)據(jù)接入百度跨年齡人臉識別系統(tǒng)進行對比評測,通過對孩子與父母上傳的照片做比對,初步篩選出30例疑似案例,付貴就在其中。4月1日,付貴及雙親的DNA比對成功。被拐27年后,付貴終于成功尋親,成為首例借助百度人工智能技術(shù)成功尋親的案例。
百度AI平臺部產(chǎn)品經(jīng)理楊抒含介紹說,本次“尋親”的成功看似簡單,背后卻需要從算法到篩選、標注等各項技術(shù)支持。該項目集合了百度IDL、AIP、AIQA等多個部門的十幾位技術(shù)同學加入,成立了“AI尋人”虛擬團隊。然后從人臉照片上,提取所有的面部特征(眉毛、眼睛、鼻子、臉型輪廓等),把這些特征換算成不同維度,并給每個維度配比上不同的權(quán)重。當兩張照片進行對比時,會針對每個維度挨個對比,得出每個維度的相似度得分,再根據(jù)每個維度的權(quán)重比例計算出總體的匹配度得分,給出兩張臉的相似程度。
IDL主任林元慶表示,影響人臉識別的因素有很多,跨年齡人臉識別困難更大。為此,百度深度學習研究院采用度量學習的方法,并用大規(guī)模人臉數(shù)據(jù)訓練好的模型作為底座,然后用跨年齡數(shù)據(jù)對他做更新。百度人臉測試集有2百萬人的2億張圖片作為訓練樣本數(shù)據(jù)。林元慶透露,百度目前跟公安部也有合作,希望幫助更多的走失兒童早日回家。
除了百度,微軟在這塊也有所行動。
2015年,微軟開發(fā)了一個可以幫助尋找中國走失兒童的應(yīng)用程序。該應(yīng)用程序通過微軟人臉識別應(yīng)用程序編程接口(API)尋找走失兒童。API 是一項基于微軟智能云的服務(wù),它可以對人臉圖像進行掃描,利用先進算法確定兩張人臉圖像是否為同一人。這個工具擁有高達152層的深度神經(jīng)網(wǎng)絡(luò),從而能在數(shù)萬張的照片庫中做到秒級檢索;能分析27個不同的人臉面部特征,因此即使拍攝角度不同、面部表情各異,程序也能從許多張照片中準確識別相似圖片,即使用肉眼也難以辨別的圖片。
目前,微軟已經(jīng)用其找到一些丟失兒童。其中一個男孩已經(jīng)走失了三年,通過該軟件,于今年5月18日在福州市離家50公里的救助站里被找到。
如果說,目前利用人臉識別技術(shù)尋找失蹤兒童已經(jīng)有一些成功案例,那么該技術(shù)的大規(guī)模應(yīng)用要需多久?另外,現(xiàn)在基于AI尋人的技術(shù)前提是需手動上傳照片,如果利用攝像機實時捕捉人臉,自動上傳鑒別的難度是否會更大?
對此,大華股份平安城市解決方案的高級SA周川談了一下他的看法。在周川看來,兒童走失是當今社會影響民生穩(wěn)定的重大問題,無論是出于個人疏忽,還是有意拐騙,對于丟失兒童的家庭這都是極其慘痛的噩耗。
人臉識別作為一種新興的智能分析技術(shù),正在公共安全領(lǐng)域不斷得到應(yīng)用。但他同時補充說,其實自人臉識別提出至今,尚沒有一套完整、成熟的人臉系統(tǒng)可以提供全方位的采集服務(wù),并且人臉算法在不同人種以及人員年齡等方面的研究尚在進行中,而對兒童的臉部特征分析的算法訓練也還不足,若要說能輕松應(yīng)對兒童找回的問題,是不實際也是不負責任的。
“但可以利用現(xiàn)有技術(shù)為尋找走失兒童提供一些幫助。”他緊接著說道。
在兒童走失這一問題上,存在兩個關(guān)鍵角色,一個是受害人,也就是走失兒童;另一個是加害人,也就是我們常說的人販子。
一、針對犯罪嫌疑人。作為兒童走失問題的加害者,人販子一般具有以下特點:
1、經(jīng)常出入兒童較多的場所(如婦產(chǎn)醫(yī)院,兒童游樂場所等);
2、人販子大多是成年人,面部特征成熟;
3、人販子存在一定比率的前科人員。
針對這些特點,人臉識別技術(shù)可以依托其精準的智能識別算法,在適用的場合為辦案人員提供幫助。這里需要考慮事前、事中、事后三個環(huán)節(jié)。
事前:針對人口販賣的前科人員,有必要將他們的信息錄入到重點人臉布控名單中;
事中:通過在關(guān)鍵區(qū)域部署的高清攝像機或人臉抓拍機,當兒童在醫(yī)院、游樂園、火車站等場所走失時,可以通過視頻圖像數(shù)據(jù)尋找嫌疑人圖像,通過嫌疑人的正臉圖像與人臉庫進行比對,確認人販子身份;
事后:通過大規(guī)模的人像天網(wǎng)建設(shè),對人販子進行大范圍的人臉動態(tài)識別,實現(xiàn)快速精準定位,為抓捕、找回走失兒童提供數(shù)據(jù)支持。
二、 針對走失兒童。作為受害人,兒童分為兩個年齡階段:
1、嬰幼兒,缺乏臉部圖像數(shù)據(jù),且面部特征較不明顯,容易混淆;
2、3歲以上兒童,大多有臉部圖像數(shù)據(jù),行動能力較強,面部特征較明顯。
首先,相關(guān)各方應(yīng)該創(chuàng)建丟失兒童庫,將丟失兒童個人信息,包括人臉圖片錄入其中。當兒童走失時,針對嬰幼兒,可以將視頻資源進行結(jié)構(gòu)化提取,通過家人描述的特征(如小孩穿著衣服的顏色等)與視頻中的結(jié)構(gòu)化數(shù)據(jù)進行比對,從而為尋找嬰兒提供線索;針對3歲以上兒童,除了結(jié)構(gòu)化特征數(shù)據(jù)的比對,還可以利用人像卡口實時比對,來尋找走失兒童軌跡。
他強調(diào)說,現(xiàn)在人臉識別技術(shù)對于成年人的實時比對已經(jīng)比較成熟。要快速精準的定位人員,還需要進行人像抓拍設(shè)備的增點建設(shè),做到點、線、面結(jié)合,把面鋪廣,建立起大而全的人像天網(wǎng)。人販子在犯案后往往也較為警覺,如何設(shè)置一些關(guān)鍵的管理卡口也將是需要考慮的問題之一。
但他同時坦承,隔代、模糊等復(fù)雜場景由于原有數(shù)據(jù)質(zhì)量較差,這方面圖像的比對效率在目前學術(shù)界中依然是個難題。不過學術(shù)界也在不斷優(yōu)化算法,相信未來應(yīng)該可以獲得突破。雖然現(xiàn)有人臉技術(shù)還無法完全應(yīng)對走失兒童找回問題,但是在不遠的將來,通過算法的優(yōu)化以及技術(shù)演變,人臉識別有能力成為處理該問題的利器之一。
之后,周川還談了一下該技術(shù)的大規(guī)模應(yīng)用。他認為,該技術(shù)距離大規(guī)模應(yīng)用的時間至少還需要2到3年。
主要有兩大難點。
一是技術(shù):例如人臉算法還需優(yōu)化,對兒童的面部特征深度學習有待加強;
二是管理:政府對于兒童走失的預(yù)防手段需要做普及,不僅要加強百姓的防范意識,也要優(yōu)化并解決相關(guān)場所的管理漏洞,將人口販賣扼殺于搖籃之中。此外,目前還有一些新興技術(shù)也可以參與到其中,比如無線射頻產(chǎn)品,通過給兒童佩戴具有無線射頻技術(shù)的手環(huán),也可以幫助快速找到走失兒童。
除了大華股份周川外,宇視行業(yè)產(chǎn)品線總工湯立波也對此技術(shù)的應(yīng)用作出評價。
在他看來,如果該技術(shù)最終能大規(guī)模應(yīng)用的確很有意義,它能夠幫助到很多家庭重拾幸福。他同時也和雷鋒網(wǎng)介紹了人臉識別應(yīng)用于尋找丟失兒童的相關(guān)技術(shù)和難點。在他看來,基于人臉識別技術(shù)尋找丟失兒童與傳統(tǒng)所見的人臉識別技術(shù)相差無幾,唯一的特殊性是跨年齡段識別,而這需要調(diào)整某些面部細節(jié)參數(shù)的權(quán)重。
他解釋說,人臉識別從技術(shù)原理上來說,正常情況下在照片中找到人臉的主要器官例如眼睛、嘴巴、鼻子、三角區(qū)等,再對這些器官部位進行特征化處理并比對。我們知道,人臉每個部位的特征在不同的年齡段,以及在體重變化等情況下,是會有不同程度的變化的。所以如果用人臉識別技術(shù)來尋找丟失兒童,就需要通過機器學習去調(diào)整相關(guān)不同部位的比重,從而可以更精準的識別不同年齡段的照片。
而后,宇視行業(yè)產(chǎn)品線總工還談了一下對百度、微軟的尋人案例的看法。
他認為,目前還無法通過百度、微軟的尋人案例判斷這兩家公司的算法成熟度。
一是,算法的準確率是一個統(tǒng)計值,很難從幾個案例里得到“是否成熟”的結(jié)論,如果在幾百甚至上千案例中,就只有一個成功案例,那么它也只能用來作宣傳用;
二是要從公安的實用角度來看待這個問題。人臉識別的準確率要加先決條件——Top N。人臉識別的輸出結(jié)果是“相似度”,也就是識別的是一張人臉和另一張人臉的相似程度,而不是“絕對值”,所以在實際操作過程中,比對得到的結(jié)果是名單庫中的相似度排名,并不是唯一結(jié)果。那么公安部門在使用過程中其實有兩種用法,被動查詢和主動比對。前者比較容易,在TOP20、TOP50有一個比較好的準確率就能使用;后者,也就是要在攝像機的圖像里實時分析這個人有沒有可能是走失兒童,就要求很高,要求TOP1有很高的準確率,至少要達到95%以上的。否則要么識別不出來,要么大量的誤報,公安干警沒法用。
另外他也談到的該技術(shù)的大規(guī)模應(yīng)用。在他看來,這個技術(shù)從技術(shù)準備度來說已經(jīng)相對成熟,但在實際應(yīng)用中還存在諸多困難,主要包括兩點:
一、要訓練更好的算法,必須收集足夠多的樣本,跨年齡段最大的瓶頸和難點就是拿不到每個人不同年齡段成組的照片進行訓練;
二、從建設(shè)角度來看,目前還不清楚是政府單獨實施還是和機構(gòu)一起合作解決這個問題。誰來建設(shè),誰來使用,誰來維護,這些都是問題。
綜合以上兩點,對于短期內(nèi)此技術(shù)的大規(guī)模應(yīng)用還持懷疑態(tài)度。
除了兩家安防巨頭,安防資深專家朱明初教授也和雷鋒網(wǎng)交流了一下他的看法。
他透露,其實這個項目由來己久,主要用到多維動態(tài)人臉識別技術(shù),目前一些頂尖公司的識別技術(shù)已經(jīng)可以解決跨年齡識別問題,但識別率相較傳統(tǒng)識別會低一些;另外,公安部已經(jīng)建立了丟失兒童人臉信息庫。但他同時表示,大規(guī)模應(yīng)用還不可行。一方面兒童丟失后揀到兒童的一方不報案或藏起來,則得不到人臉信息,無法比對;另一方面,大量布控會產(chǎn)生天量費用。總而言之,技術(shù)上沒難點,難在落實上,這需要全社會參與進來,數(shù)年內(nèi)推廣到基層應(yīng)用比較困難。
從以上三位專家的論述中,我們知道,該技術(shù)針對成年人的面部特征識別已經(jīng)非常成熟,但應(yīng)用在嬰幼兒群體,還需要建立相應(yīng)數(shù)據(jù)庫,方便后期比對。從這來看,除了企業(yè)努力攻克技術(shù)難關(guān)外,還需要政府相關(guān)部門作出努力。
目前,人臉識別技術(shù)作為AI落地的重中之重,已經(jīng)在很多行業(yè)中得到應(yīng)用。也許,除了微軟、百度外,未來會有更多科技公司都可以利用基于AI等技術(shù)解決各類社會難題。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。