0
原標(biāo)題 | Object Recognition, simplified !
作者 | Ulysse-pacome koudou
譯者 | Aitechnology(曠視算法研究員)、汪鵬(重慶郵電大學(xué))、Dylan的琴(重慶郵電大學(xué))
本文編輯:王立魚
原文鏈接:
https://medium.com/data-science-demystified/object-recognition-made-easier-61eb8b5fa3fa
阿爾伯特·愛因斯坦曾經(jīng)說過這么一句話“如果你不能簡單地解釋它,你就不能很好地理解它”,我深以為然!
尤其是在計算機(jī)視覺領(lǐng)在業(yè)務(wù)中,阻止AI發(fā)展的主要障礙之一是深度學(xué)習(xí)解決方案是需要完全掌握和理解這些工具的工作方式,這是極其復(fù)雜的。
除此之外,還有為業(yè)務(wù)案例開發(fā)和實(shí)施正確的解決方案的時效性。顯然,該列表并非詳盡無遺,因此企業(yè)在實(shí)施此類工具時會慢慢采取行動。我還要補(bǔ)充說,與一個更簡單且可能更舊的解決方案相比,評估實(shí)現(xiàn)特定案例的AI解決方案的價值是非常好的,但如果工具本身并沒有得到很好的理解,有時可能會遇到挑戰(zhàn)?!癆I”,“機(jī)器學(xué)習(xí)”,“深度學(xué)習(xí)”是當(dāng)下的流行語,每個人都希望發(fā)展自己的AI點(diǎn),增強(qiáng)客戶體驗和理解,探索更多并擴(kuò)展他們的專業(yè)范圍,這是很好的!#GoA.I。
這是一個幫助我們實(shí)現(xiàn)對象檢測算法作為解決方案工具的解決方案。非常感謝John Olafenwa及其團(tuán)隊構(gòu)建ImageAI軟件包,這使得程序員的生活變得更加輕松,不僅可以使用,還可以了解對象檢測的工作原理。//深入了解DeepQuestAI。使用ImageAI實(shí)現(xiàn)測試只能在幾行中完成,快速而強(qiáng)大。
要求:
Jupyter 筆記本安裝了Tensorflow和Keras。
你可以使用Anaconda Navigator在JN上安裝Tensorflow和Keras,只需選擇您的環(huán)境并在搜索欄中寫入包名稱(注意:確保選擇未安裝)
從Anaconda 安裝Tensorflow
從原文下載ImageAI軟件包,雖然Anaconda尚未提供,但誰知道明天會發(fā)生什么?
下載H5Py存儲Numpy矩陣的圖像,更多信息可以參看H5py_website。
最后但同樣重要的是,激情。請喜歡和享受你正在做的事情,如果你對你正在編碼的內(nèi)容不感興趣,編碼會變得非常無聊,即使這只是一行代碼。成功=時間+激情。
要安裝的庫:Scipy,Numpy,OpenCV,Tensorflow,Pillow,Matplotlib和Keras。
注意:確保將H5py和ImageAI保留在工作目錄中!
現(xiàn)在我們已經(jīng)完成所有設(shè)置,我們將通過幾行代碼來識別圖像文檔中的大多數(shù)基本對象。在我們使用Jupiter Notebook之前設(shè)置,確保所有下載都在工作目錄中。
作為輸入,我們將在2015年夏天在蒙特利爾某處拍攝一張非常漂亮的照片,目標(biāo)最終將是檢測照片上的內(nèi)容,是否有汽車,人物?更多?多少。
2015年夏季
首先要安裝ImageAI
這是命令行應(yīng)該返回的結(jié)果。然后加載所有必要的包。
對于實(shí)際的檢測我們使用的是著名的開源庫OpenCV,然后基于Tensorflow的Keras預(yù)訓(xùn)練模型我們搭建神經(jīng)網(wǎng)絡(luò)。實(shí)際上永遠(yuǎn)不要忘記,Matplotlib可以清晰的對檢測到的方形區(qū)域進(jìn)行判別,np框架能夠用來存儲數(shù)據(jù)(再一次發(fā)揮巨大作用!)最后我們將工作目錄聲明為可執(zhí)行路徑,方面后面使用H5py。
點(diǎn)擊此處查看完整代碼
現(xiàn)在John的團(tuán)隊通過創(chuàng)建很長的、痛苦的和復(fù)雜的代碼來實(shí)現(xiàn)這一目標(biāo)。通過簡單的調(diào)用神經(jīng)網(wǎng)絡(luò)的額模型并將圖片作為輸入可以使你的編碼 變得更容易。最終,你可以在工作目錄下得到輸出結(jié)果。
所有這一切都很不錯,但是我們依然希望得到結(jié)果。。。這有一個簡單的函數(shù)可以打印出名字和通過網(wǎng)絡(luò)預(yù)測得到的概率。
在這種情況下,我們引用了三個輸出項,輸出圖像,檢測到的對象的名稱及其概率百分比。我們有圖像,這里是proba的百分比。名字看起來像這樣:
不一定按順序給出,我們的模型已成功檢測到我作為前景中的人,自行車,即使完整的自行車不在圖片上,另一方面,后面至少有四輛車和幾個人。由于特征提取,背景和形狀,我身后的綠色汽車被檢測到三次。我們可以深入研究這個問題,但這是一個全新的主題,我建議你閱讀這篇文章以獲取更多信息。
對這個結(jié)果感到滿意,我又嘗試了另一張圖片,看看模型可以做到什么程度吧。
而且它再次令人印象深刻,能夠以66%的概率檢測到背包。并且能夠區(qū)分汽車和卡車,但在第二個例子中有幾個人沒檢測到。這仍然是由于特征提取和形狀的問題,希望模型會變得更好點(diǎn)!
完整代碼查看請點(diǎn)擊這里:
我們最后一件事沒有涉及的是何時使用物體檢測?如果你還沒有對此做出響應(yīng),可以閱讀這篇文章,它提供了有關(guān)如何使用對象檢測的七個有趣想法。記住,不要局限于這些想法!雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)?
點(diǎn)擊【簡易版物體識別!】即可訪問~
Github項目推薦 | AMD GPU上的HD畫質(zhì)50fps實(shí)時車輛檢測
本項目使用深度學(xué)習(xí)網(wǎng)絡(luò)Yolo-V2以高清分辨率(1920x1080)以驚人的50幀/秒的速度檢測實(shí)時交通中的汽車/公共汽車。 項目中使用的模型針對使用MIVisionX工具包在AMD-GPU上的推理性能進(jìn)行了優(yōu)化。
詳情查看:https://ai.yanxishe.com/page/blogDetail/13656
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。