0
近日,創(chuàng)新奇智憑借突破性的單目標跟蹤算法,在通用單目標跟蹤測評數(shù)據(jù)集GOT-10k(Generic Object Tracking Benchmark)上,以絕對優(yōu)勢獲得冠軍。
GOT-10K數(shù)據(jù)集由中科院發(fā)布,包括超過10000條取材于真實世界的視頻片段和560多個類別,超過150萬個手動標記框,具備場景豐富、算法挑戰(zhàn)難度高等特點。
創(chuàng)新奇智奪冠的單目標跟蹤算法,具有較強的魯棒性,有效克服了人或物在運動中各種復雜因素的干擾。目前,該算法已成為創(chuàng)新奇智MatrixVision視頻智能平臺上的重要算法資產(chǎn),正在工業(yè)安全生產(chǎn)和公共服務等領域發(fā)揮作用。
來源于:http://got-10k.aitestunion.com/leaderboard
GOT-10K數(shù)據(jù)集由中國科學院自動化研究所CASIA的智能系統(tǒng)與工程研究中心發(fā)布并維護,是具有國際權(quán)威的通用單目標跟蹤算法評測數(shù)據(jù)集。其中訓練集由10000個視頻序列組成,全部取材于現(xiàn)實世界里移動的物體,包含563個目標類別與87種運動模式。物體的邊界框全部是手動標記,總計超過150萬個。
測試集由180個視頻序列組成,包含84類移動物體和32種運動模式,且訓練視頻與測試視頻之間所有的對象不重疊。
GOT-10K數(shù)據(jù)集是以WordNet英文詞匯數(shù)據(jù)庫作為骨架搭建起來的,分為5個大類:動物(Animal)、人造物體(Artifact)、人物(Person)、自然物體(Natural Object),以及Part。在這個大類別之下再細分成563個類別,不過這只是其中一個標簽,另外一個標簽是動作類別,共有87種運動模式,極具挑戰(zhàn)性,吸引了海內(nèi)外廣大學者和知名學術(shù)機構(gòu)參與。
目標跟蹤算法是為模擬人眼在目標運動估計和跟蹤方面的能力,給定一個目標的初始位置,然后跟蹤算法會負責輸出后續(xù)幀中該物體的位置。同時,算法要克服物體在運動中存在的諸如運動模糊、運動遮擋、外觀變化、光照變化、背景相似干擾等因素的影響,才能獲得好的算法性能。
創(chuàng)新奇智跟蹤算法能夠有效地解決上述問題,還具備超強的魯棒性。該算法以DIMP算法為骨干,首先使用孿生網(wǎng)絡來同時提取訓練數(shù)據(jù)集和測試圖像的特征,然后加入一個模型優(yōu)化器,再加入背景信息對初始幀得到的卷積層進行權(quán)重優(yōu)化,然后使用自研的損失函數(shù)能夠解決正負樣本不均衡的問題,同時讓優(yōu)化網(wǎng)絡能夠有效地提取前景和背景的特征,做出具備魯棒性的判斷。
DIMP網(wǎng)絡
目標跟蹤任務是計算機視覺領域的重要任務,廣泛使用在智能視頻監(jiān)控、工業(yè)視覺的安全生產(chǎn)等領域。該先進算法已經(jīng)收錄在創(chuàng)新奇智MatrixVision視頻智能平臺上面。該平臺預先內(nèi)置圖像分類、物體檢測、圖像分割、目標跟蹤等多種算法,可以快速靈活得整合外部軟硬件,讓交付變得更輕,同時讓各個功能算法更好地適配到各個硬件平臺上面。目前,MatrixVision已經(jīng)支持智慧工地,智慧園區(qū),明廚亮灶,智慧油站,智慧防疫,智慧電梯等6大邊緣場景,提供車輛車牌識別追蹤、明火煙霧檢測、行人識別追蹤、安全服帽檢測等多種檢測任務。
明廚亮灶功能應用
智慧電梯功能應用
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。