0
今天這個(gè)比賽,得從一個(gè)做程序猿的鏟屎官開始說起......
話說,有一天「鏟屎猿」早起之后,發(fā)現(xiàn)貓主子竟然沒了身影;他找啊找啊,找了好久,可仍然到處都沒找到貓主子。這時(shí),客廳突然傳來了一聲貓叫,鏟屎猿循聲而至,只見沙發(fā)上躺著一個(gè)難以辨識的,「東西」?
這東西似貓又非貓,似狗又非狗,鏟屎猿眉頭一皺,發(fā)現(xiàn)事情并不簡單!難道這就是喵星人統(tǒng)治世界的第一步:隱藏身份,安能辨我是貓狗嗎?
笑話,我等人類豈非爾等貓輩能夠打?。幌氲酱颂?,鏟屎猿說道:「看來,是時(shí)候展現(xiàn)我猿真正的技術(shù)了——絕殺,關(guān)鍵點(diǎn)檢測技術(shù)!」
沒錯(cuò),鏟屎猿口中的關(guān)鍵點(diǎn)檢測技術(shù),正是廣泛用于計(jì)算機(jī)視覺任務(wù)的基礎(chǔ)方法,即通過某些事物的特征關(guān)鍵點(diǎn),對這些點(diǎn)進(jìn)行捕捉與識別。
但別看它基礎(chǔ),關(guān)鍵點(diǎn)檢測是人臉識別和分析領(lǐng)域中的關(guān)鍵一步,它是諸如自動(dòng)人臉識別、表情分析、三維人臉重建及三維動(dòng)畫等其它人臉相關(guān)問題的前提和突破口。
同時(shí),在表情分析、異常行為檢測、美顏換裝,甚至是自動(dòng)駕駛等圖像識別類應(yīng)用領(lǐng)域,該技術(shù)也是不可替代的支撐。因此,有了這一技術(shù),鏟屎猿就能夠設(shè)計(jì)相應(yīng)的方案,對這些「狡猾的」喵喵們進(jìn)行身份確認(rèn)了~
那要怎樣運(yùn)用這一技術(shù)呢?鏟屎猿在研究過程中,借鑒了人臉識別的三種方法,它們分別是基于模型的 ASM 方法、基于級聯(lián)形狀回歸的 CNN 回歸法以及基于深度學(xué)習(xí)的方法。
一、ASM 人臉識別
該方法也被稱為采用主動(dòng)形狀模型(Active Shape Model,簡稱 ASM)的方法,這是較早出現(xiàn)的關(guān)鍵點(diǎn)檢測方法,與大多數(shù)統(tǒng)計(jì)學(xué)習(xí)方法類似,包括了 rain 和 test 兩部分。
它會(huì)對不同形狀進(jìn)行計(jì)算機(jī)自動(dòng)標(biāo)定、校準(zhǔn),運(yùn)用主成分分析法獲取不同形狀的模型,然后將模型與實(shí)際圖形進(jìn)行灰度匹配,提取像素?cái)?shù)目比等特征參數(shù),從而實(shí)現(xiàn)人臉識別。
可參考文獻(xiàn):
二、 CNN 回歸法
此種方法屬于基于級聯(lián)回歸的人臉檢測方法。由于卷積神經(jīng)網(wǎng)絡(luò)可以用于分類和回歸任務(wù),通過利用卷積神經(jīng)網(wǎng)絡(luò),將訓(xùn)練圖像劃分到多個(gè)類別,再采用多層級進(jìn)行訓(xùn)練,從而對提取的面部關(guān)鍵點(diǎn),如:左眼、右眼、鼻子、嘴巴進(jìn)行檢測。
值得注意的是,卷積神經(jīng)網(wǎng)絡(luò)當(dāng)用于做回歸任務(wù)時(shí),最后一個(gè)全連接層的輸出維度則是要回歸的坐標(biāo)值的個(gè)數(shù),同時(shí),其采用的是也歐幾里何損失 Euclidean Loss。
可參考文獻(xiàn):
https://github.com/zhaoyuzhi/Deep-Convolutional-Network-Cascade-for-Facial-Point-Detection
三、深度學(xué)習(xí)方法
隨著神經(jīng)網(wǎng)絡(luò)的迅速發(fā)展和其對圖像數(shù)據(jù)的強(qiáng)大的特征提取,深度學(xué)習(xí)運(yùn)用于人臉識別也取得了很好的效果。其中,LFW 數(shù)據(jù)集(Labeled Faces in the Wild)是目前用得最多的人臉圖像數(shù)據(jù)庫。
該方法的核心內(nèi)容為首先將圖片中的人臉檢測處理并通過關(guān)鍵點(diǎn)進(jìn)行對齊,然后通過一定方法將得到的關(guān)鍵點(diǎn)數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò),得到特征向量,再之后利用分類訓(xùn)練過程,則可得到人臉的特征向量。
參考論文:
研究清楚關(guān)鍵點(diǎn)檢測的技術(shù)原理之后,鏟屎猿將人臉的關(guān)鍵點(diǎn)換為了貓臉的關(guān)鍵點(diǎn),包括:貓眼睛、鼻子、嘴巴、耳朵等特征;經(jīng)過一系列實(shí)驗(yàn),終于開發(fā)出了可用于檢測貓臉的方法。貓臉檢測后的效果如下:
同時(shí),這一工具不光可以對貓的身份進(jìn)行了檢測確認(rèn),同時(shí)它還設(shè)計(jì)了更多貼心的功能,可以檢測咪咪的毛發(fā)、五官神態(tài)、精神狀態(tài)等,從而更好的了解咪咪的健康狀況。
除此之外,鏟屎猿還計(jì)劃將來能夠開發(fā)出檢測咪咪活動(dòng)、進(jìn)食、玩耍、如廁等數(shù)據(jù)的工具,等到那時(shí),咪咪們可就不能造反了哦~
但令鏟屎猿萬萬沒想到的是,在能夠確認(rèn)自家咪咪身份的時(shí)候,喵星人危機(jī)已經(jīng)大量爆發(fā)于世界各地。
為了防止世界被破壞,為了維護(hù)世界的和平,AI 研習(xí)社(https://god.yanxishe.com/)特邀天下程序猿星人,共同開發(fā)識別性能更強(qiáng)、準(zhǔn)確度更高的貓臉檢測工具,來讓這些待識別的貓主子被認(rèn)領(lǐng)回家~
本次大賽「貓臉關(guān)鍵點(diǎn)檢測」的目標(biāo)是檢測貓臉的 9 個(gè)關(guān)鍵點(diǎn)。相關(guān)的數(shù)據(jù)集訓(xùn)練集有 10468 張,測試集 9526 張。其中訓(xùn)練集每張圖都對喵喵的 9 個(gè)關(guān)鍵點(diǎn)進(jìn)行了標(biāo)注,標(biāo)注信息為坐標(biāo)信息。
開始時(shí)間:2019-12-19 09:00:00
結(jié)束時(shí)間:2020-01-18 00:00:00
大賽還提供了免費(fèi)云訓(xùn)練 GPU 資源,以及基礎(chǔ)獎(jiǎng)金池為 2000 元哦~比賽一共設(shè)置了三種獎(jiǎng)項(xiàng),包括了:參與獎(jiǎng)(30%)、突破獎(jiǎng)(20%)、排名獎(jiǎng)(50%)。
三種獎(jiǎng)項(xiàng)互不沖突,拯救地球的同時(shí),再賺他個(gè)千來塊,豈不是也能買好多杯奶茶了呢!
數(shù)據(jù)集下載鏈接:
最終提交結(jié)果文件如下所示,其中,第一個(gè)數(shù)據(jù)為測試集圖片 ID(即文件名);后面的 18 個(gè)數(shù)據(jù)為 9 個(gè)關(guān)鍵點(diǎn)(每個(gè)關(guān)鍵點(diǎn)對應(yīng)兩個(gè)數(shù)據(jù)),每一行共包含 19 個(gè)數(shù)據(jù)。
Ps:建議使用 UTF-8 編碼,提交前請確認(rèn)結(jié)果文件預(yù)測樣本數(shù)量共計(jì) 9526 條,因?yàn)閿?shù)量不足可能導(dǎo)致無法評分哈~
整個(gè)比賽的評審?fù)耆该骰?,我們將?huì)對比選手提交的結(jié)果文件,按照如下公式計(jì)算得分,其中:
MAE:平均絕對誤差,可以更好地反應(yīng)預(yù)測與實(shí)際結(jié)果的誤差情況。
每日 24:00,我們也會(huì)將最新結(jié)果更新在官網(wǎng)排行榜上。是貓還是狗,你說了算!
更多信息,可進(jìn)入?yún)①愔黜摬榭?,快讓你的大名出現(xiàn)在拯救地球榜單上吧:
雷鋒網(wǎng) AI 開發(fā)者 雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。