0
本文作者: 張棟 | 2017-10-31 23:54 |
安全是城市的基礎(chǔ),沒有安全、和諧的環(huán)境,城市化進(jìn)展毫無意義。
對于城市安防來說,要解決的大部分問題都可歸結(jié)為視頻中的“找車”“找人”。據(jù)數(shù)據(jù)統(tǒng)計(jì),截至2020年,全球攝像機(jī)的數(shù)量預(yù)計(jì)將增至10億臺,海量數(shù)據(jù)對存儲、寬帶、處理、計(jì)算都帶來巨大壓力。過去的老方法是靠專家模型來做,其實(shí)就是手寫程序,正確率最多能做到70%多。如果要尋找一個(gè)人,這70%幾的正確率相當(dāng)于沒有應(yīng)用于實(shí)際場景中。
幸運(yùn)的是,大概在2012年底深度學(xué)習(xí)誕生了。即此,人們有了深度學(xué)習(xí)、非結(jié)構(gòu)大數(shù)據(jù)、計(jì)算量三個(gè)要素。如果靠傳統(tǒng)CPU計(jì)算的話,能源消耗、成本各方面都會吃不消。GPU計(jì)算是一個(gè)革命性的并行計(jì)算模式,很好的推進(jìn)了深度學(xué)習(xí)和大數(shù)據(jù)。這三件事結(jié)合在一起使得人們能夠在AI City上做一些事情。
那么到底何為AI City?它解決了什么現(xiàn)實(shí)問題?由此,在2017安博會期間,NVIDIA亞太區(qū)戰(zhàn)略運(yùn)營與合作伙伴副總裁潘迪詳細(xì)解釋了AI City并展示了NVIDIA Metropolis全新端到云的智慧城市解決方案。
潘迪說,AI City中要解決的一個(gè)是人的問題,另一個(gè)是車的問題。圍繞視頻整合一起就是解決城市安防安全問題;從政府治理角度來講,他們有兩個(gè)目的,一個(gè)是管理,另外一個(gè)是通過管理來服務(wù)。
他認(rèn)為,對于AI City而言,有兩個(gè)方面非常重要:
一、高效。城市資源有限,如何在有限的資源里讓城市發(fā)揮更多作用;
二、安防監(jiān)控。過去談數(shù)字城市,后來有了Wifi和3G之后又談網(wǎng)絡(luò)城市,再后來一直談智慧城市,現(xiàn)在人們談AI City,如何用AI技術(shù)讓城市更智能,這是循序漸進(jìn)的過程。
在潘迪看來,在處理城市建設(shè)中的海量數(shù)據(jù)方面,AI比人力更擅長。由深度學(xué)習(xí)驅(qū)動的AI計(jì)算機(jī)能夠顛覆傳統(tǒng)數(shù)據(jù)處理、分析的方式,高效整合海量圖像信息并將其轉(zhuǎn)化為深層次的理解。從數(shù)據(jù)采集,存儲,處理到推理運(yùn)用,城市視頻監(jiān)控分析人員每日面臨復(fù)雜挑戰(zhàn)。以往單純依靠人員監(jiān)控的方式僅能覆蓋視頻監(jiān)控?cái)?shù)據(jù)的鳳毛麟角,而早期視頻分析系統(tǒng)的處理能力正確度遠(yuǎn)遠(yuǎn)低于人類。
過去都是靠摩爾定律這樣一種方式實(shí)現(xiàn)每一年半翻一番的。今天摩爾定律不存在了,因?yàn)镚PU計(jì)算比摩爾定律還要加速。對整個(gè)節(jié)能和成本控制來講,不是20%、30%的提高,而是幾十倍的提升。從人臉識別、物理物體識別等方面來講,機(jī)器已經(jīng)成為“超人”,達(dá)到90%多的正確率。在安防領(lǐng)域也有很多試點(diǎn)和應(yīng)用。
以下是采訪實(shí)錄,雷鋒網(wǎng)作了不改變原意的整理與編輯:
AI City中包含零售、安防、交通等各個(gè)場景,您覺得最佳的落地場景是什么?
潘迪:我認(rèn)為安防是個(gè)剛需,它落地場景非常廣泛。其實(shí)我們這邊有一些分析,如果從整個(gè)市場來看的話,大約70%圍繞著車和人的安防,另外30%左右會解決金融、商業(yè)這些問題。
這些安防廠商提到的更多的需求點(diǎn)在哪里?他們需要你們解決什么問題?
潘迪:摩爾定律已經(jīng)消失,今天我們談到的不是20%的TCO,而是10倍,20倍的,即使你做的很多,客戶還是會希望更多更好。所以這里我再舉個(gè)例子,用TensorRT 3.0做優(yōu)化的話,推理可能可以達(dá)到100倍的提升。如果我們不去做優(yōu)化,可能10倍左右,所以其實(shí)客戶的需求是什么呢?省錢,這是一塊。另外一塊,我們也看到現(xiàn)在隨著新技術(shù)的發(fā)展,包括AR、VR,客戶也希望有這些新的技術(shù),包括我們在談到AI City時(shí)說的,能不能用三維的方式來描述客戶?
(其他嘉賓:這點(diǎn)我稍微補(bǔ)充一點(diǎn),所謂完整的方案是因?yàn)樵谶^去這幾年我們在國內(nèi)的客戶,包括全球客戶在做合作的時(shí)候,發(fā)現(xiàn)其實(shí)對于CUDA或者GPU的開發(fā)其實(shí)很多人都會碰到難處,尤其是AI現(xiàn)在來得這么快,其實(shí)很多廠商都想加入到AI領(lǐng)域,或者在他們的產(chǎn)品上把AI的功能加上。但是之前比方說他對于CUDA或者GPU不熟的情況下,短期內(nèi)開發(fā)GPU的產(chǎn)品可能就成為一個(gè)瓶頸。所以說我們才會開發(fā)TensorRT,還有整個(gè)的SDK,如果大家可以看到我們比方說像十幾行的代碼就可以幫你把神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),而且性能是非常好,因?yàn)槔锩娴膬?yōu)化,包括里面GPU的加速全都是NVIDIA做的。
這樣的話能夠保證最大程度的挖掘出GPU的能力,就像剛才潘總講的第二點(diǎn),其實(shí)就是說未來網(wǎng)絡(luò)發(fā)展的前景我們現(xiàn)在還沒有看到它的盡頭,并不是說我們現(xiàn)在做人臉,或者說做一些目標(biāo)檢測或者車的一些檢測,這就到了世界終點(diǎn),并不是這樣。比方說我們可以看到車和人的檢測,其實(shí)大多數(shù)都是單幀檢測,未來會不會有多幀里面的跟蹤算法,還有包括分辨率會不會越來越大,現(xiàn)在客戶給我們的回答都是非常非常正面,認(rèn)為在將來,其實(shí)這個(gè)計(jì)算力也會持續(xù)上升。)
您認(rèn)為這就是未來AI在安防行業(yè)中的發(fā)展趨勢嗎?
潘迪:這個(gè)世界隨時(shí)隨地都在變,治理部門、管理部門要面對這種變化,所以我相信今天可能并不需要或者不存在的需求,明天可能就會有。所以應(yīng)用創(chuàng)新很重要,這里面包括商業(yè)模式。比如最近這幾年,共享單車、外賣火熱,這是幾年前我們想象不到的。
安防從本質(zhì)上來看就是安全防范,公安對安防最大的需求是預(yù)測,比如會不會發(fā)生犯罪或交通事故?在這方面NVIDIA怎么看?
潘迪:事實(shí)上安防包含兩方面,一個(gè)是管理,另外一個(gè)是服務(wù),我覺得服務(wù)可能比管理還要重要,其實(shí)很多事情發(fā)生以后你再去做,還不如預(yù)防。比如公安要隨時(shí)統(tǒng)計(jì)進(jìn)出人數(shù),就是為了管理,而管理的目的就是預(yù)防。
這種場景想象的空間非常大,這也是為什么我們需要很多初創(chuàng)企業(yè)。NVIDIA有一個(gè)Inception Program(創(chuàng)始計(jì)劃),就是針對眾多的初創(chuàng)企業(yè)、新型企業(yè)。當(dāng)然很多初創(chuàng)企業(yè)都是圍繞著技術(shù)層面,但是我相信也有很多初創(chuàng)企業(yè)圍繞著應(yīng)用、圍繞著商業(yè)模式。
過去我們一直覺得計(jì)算很困難。隨著5G網(wǎng)絡(luò)的發(fā)展,可能集中式“面”的管理會越來越多。
在安防領(lǐng)域、實(shí)際場景識別率與實(shí)驗(yàn)室中相差甚遠(yuǎn),如果說技術(shù)不是問題,而且應(yīng)用場景也非常明確,那么為什么實(shí)際效果是這樣的?它的關(guān)鍵問題出在哪兒?
(其他嘉賓回答:首先一點(diǎn),我覺得這可能更多是技術(shù)層面,其實(shí)之前有很多其他客戶問過類似的問題,但實(shí)際上跟我們非常緊密的合作伙伴像???、大華并沒有造成這樣的問題,識別率會明顯的下降。本身深度學(xué)習(xí)就是基于海量數(shù)據(jù)庫,數(shù)據(jù)越多,識別率或者準(zhǔn)確率是會穩(wěn)定上升的。我懷疑可能您的50%來自傳統(tǒng)模式,這也是為什么傳統(tǒng)模式在遇到數(shù)據(jù)量大的問題時(shí),準(zhǔn)確率會下降。這是之前碰到的情況。第二點(diǎn),現(xiàn)場安裝的問題,比如說剛才潘總講到的應(yīng)用還有場景是緊密結(jié)合在一起的,為什么這么說?比如說我的場景是零售,聚焦室內(nèi),人的頭像也比較大,但是如果用在地鐵口,可能是多人,兩邊的計(jì)算力其實(shí)本身就不一樣。各家廠商做優(yōu)化的時(shí)候,比如放到車站口或者地鐵口,是為了應(yīng)付多人,但是如果把這個(gè)優(yōu)化直接放到商店里,肯定性能會稍微弱一些,所以說您可以看到,各家廠商現(xiàn)在在做一個(gè)叫定制化的服務(wù)。他們在各種各樣的云端和終端設(shè)備上都在部署自己的算法,其實(shí)里面的算法會稍微有些差別,也是根據(jù)具體場景的不同做了一些訓(xùn)練。)
NVIDIA相對其他同行有哪些技術(shù)壁壘?
潘迪:我覺得GPU本身就很獨(dú)特,對整個(gè)計(jì)算是一個(gè)翻天覆地的變化。四萬五千個(gè)圖像每秒,大概要用160個(gè)CPU的server,大概要65千瓦,4個(gè)柜子。但是現(xiàn)在用GPU這種方式的話,就一個(gè)NVIDIA HGX架構(gòu)的8個(gè)volta,3千瓦,一個(gè)箱子。在GPU的基礎(chǔ)上,我們又做了深度學(xué)習(xí)、優(yōu)化各方面的工作。如果你去做DGX-1這個(gè)服務(wù)器,里面還有很多的框架,我們針對這些框架又做了很多的優(yōu)化,比如NVIDIA Caffe的性能比一般的Caffe的性能還要高。
一個(gè)是本身這個(gè)架構(gòu), GPU計(jì)算,再加上軟件,再加上TensorRT3.0,所以我們在這方面的優(yōu)勢是很明顯的。
針對初創(chuàng)企業(yè)NVIDIA提供的服務(wù)會有什么特點(diǎn)?
潘迪:首先第一點(diǎn),對初創(chuàng)企業(yè)我們自己的系統(tǒng)會有一個(gè)優(yōu)惠的條件給他們,比如資金支持。另一方面,我們有自己的社區(qū),社區(qū)是最重要的,互相學(xué)習(xí)。第三點(diǎn),我們有系統(tǒng)架構(gòu)師、銷售人員、編程人員等等。
初創(chuàng)企業(yè)會不會因?yàn)閮r(jià)格因素而選擇使用其他方式,比如FPGA?
潘迪:我們相信他們會做一個(gè)正確的判斷。GPU的基礎(chǔ)是CUDA,有三個(gè)特點(diǎn),我們叫“3P”:power,節(jié)能;performance,性能;programability,可編程。我相信NVIDIA的價(jià)值非常明顯。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。