0
本文作者: 木子 | 2017-07-19 11:35 |
7月17日,有人工智能“世界杯”之稱的ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC-2017)正式落幕。在本屆大賽中,360人工智能團隊最終奪得冠軍,并且刷新了此前谷歌、微軟、牛津大學等機構保持數(shù)年的世界紀錄。
ImageNet大規(guī)模視覺識別挑戰(zhàn)賽被譽為計算機視覺乃至整個人工智能發(fā)展史上的里程碑式的賽事。本屆比賽共吸引了來自中美英等7個國家的25支頂尖人工智能團隊參賽。賽事共包括物體定位(識別)、物體檢測、視頻物體檢測三大類任務。最終,由360人工智能研究院與新加坡國立大學(NUS)組成的團隊在“物體定位”任務的兩個場景競賽中均獲得第一,同時在所有任務和場景中均取得了全球前三的驕人戰(zhàn)績。
360人工智能研究院院長顏水成表示:“很高興能夠在ImageNet上取得佳績,這也反映了360人工智能技術,特別是在視覺識別方面的領先實力。360非常重視人工智能在垂直領域的發(fā)展,并將人工智能技術積極應用到各類產(chǎn)品中。當下人工智能的發(fā)展不能脫離具體業(yè)務,需要在垂直領域去解決具體的問題,能落地的人工智能才是真正的人工智能?!?/p>
圖1:使用訓練數(shù)據(jù)進行分類+定位的模型訓練
物體定位(識別)、物體檢測、視頻物體檢測都是計算機視覺的核心領域,對于人工智能的發(fā)展意義重大,有廣闊的應用前景,比如人臉識別、無人駕駛、智能機器人等。在本屆賽事中,“物體定位”任務共包括兩大場景,即“使用訓練數(shù)據(jù)進行訓練”,與“使用額外訓練數(shù)據(jù)進行訓練”。
在上述任務中,360與NUS團隊合作提出的“DPN 雙通道網(wǎng)絡+基本聚合”深度學習模型均取得了最低的定位錯誤率,分別為0.062263和0.061941。值得一提的是,谷歌、微軟、牛津大學等一直在此項任務中保持世界領先地位。此次,該項紀錄最終被360與NUS團隊成功改寫。
圖2:使用額外訓練數(shù)據(jù)進行分類+定位模型的訓練
計算機視覺識別是人工智能領域的經(jīng)典命題,長久以來一直受到學術界和產(chǎn)業(yè)界的廣泛關注。ImageNet不但是計算機視覺發(fā)展的重要推動者,也是深度學習熱潮的關鍵驅(qū)動力之一。從 2010 年以來,ImageNet 每年都會舉辦一次全球性競賽,即 ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽。來自全球各國的頂級人工智能團隊會在賽事中相互較量,比拼對物體和場景進行分類和檢測的能力。這些團隊既包括谷歌、微軟、Facebook等大型互聯(lián)網(wǎng)公司,也包括伯克利、牛津大學等世界頂級名校。整個賽事也成為了各團隊、巨頭展示實力的競技場。
任何成績的取得都不是一蹴而就的,而是來自于長期的積累。顏水成表示,一直以來 ,360人工智能研究院在計算機視覺領域持續(xù)投入研發(fā)。在長時間的研究工作中,打造了一支實力強大的人工智能團隊,對于計算機視覺領域有深刻的理解。
安全與智能是360當前兩大重點。360人工智能研究院立足于世界領先的深度學習研發(fā)能力,發(fā)力視覺、語音、語義和大數(shù)據(jù)四個方向,向360相關業(yè)務部門提供技術輸出,并完成人工智能相關方向的原始技術積累和前沿探索。
目前,研究院的人工智能技術已經(jīng)廣泛應用于360的全系列產(chǎn)品中,包括直播、智能硬件、搜索和信息流等業(yè)務。未來,研究院將會推動360在人工智能方面的技術實現(xiàn)突破性進展。其中,視覺技術將進一步提升,優(yōu)化識別物體、行為等,并拓展到SLAM領域;語音分析將增強合成真實感,提高識別準確度,逐步建立基于NLP語義的對話系統(tǒng);大數(shù)據(jù)技術的提高將帶動廣告、精準推薦等。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。