0
就在林元慶離職創(chuàng)業(yè)之際,曾經(jīng)與林同門的NEC Labs系師弟、前Snap資深科學家、Snap研究院創(chuàng)始人之一王孝宇博士,于近日宣布加入深耕安防領(lǐng)域的人工智能公司云天勵飛,出任首席科學家兼AI副總裁。
如果說MSRA是軍風統(tǒng)一的黃埔軍校,那NEC Labs無疑是百花齊放的西南聯(lián)大。
前者低調(diào)、務(wù)實的風格貫穿整個人工智能研究圈,后者雷厲風行的行事風格為AI創(chuàng)業(yè)注入了源源不斷的活力,掀起多股AI浪潮。
MSRA的影響力毋庸贅言,而很多人較為陌生的NEC Labs所培養(yǎng)出的余凱、周曦等人已經(jīng)成為細分領(lǐng)域的領(lǐng)頭人之一,剛剛從百度離職的林元慶也投入到創(chuàng)業(yè)大潮,書寫自己AI歷程的下一篇章。
而今,王孝宇的歸國無疑讓智能安防江湖的角逐更加激烈。
“非常快?!?br/>
在問到回國后的第一感覺時,王孝宇不假思索的說出這三個字。
“國內(nèi)人工智能圈的節(jié)奏,無論是技術(shù)迭代還是業(yè)務(wù)推進速度都遠超硅谷,這很讓我興奮?!?/p>
連續(xù)六個月KITTI無人駕駛數(shù)據(jù)庫識別任務(wù)冠軍;2013年ImageNet美國第一,全球第二;美國國家標準局性別識別第一和年齡識別第二;大規(guī)模細粒度圖像識別研究中,二十萬張圖像數(shù)據(jù)集中識別600多種差異較小的車型,準確率高達96%。
這便是作為團隊一份子的王孝宇在NEC Labs任職期間交出的成績。
在NEC Labs打下了結(jié)實的算法基礎(chǔ)后,2015年,王孝宇加入了當時僅有一百多人的Snapchat,并與李佳一同創(chuàng)辦Snap研究院,主導Snap計算機視覺研發(fā),研究云端的視覺解決方案和手機端的人臉檢測、識別、分割方案,AR,商業(yè)圖像智能等,尤其在模型壓縮上取得了非常優(yōu)秀的成果。
當時王孝宇團隊把運行在2億手機終端的神經(jīng)網(wǎng)絡(luò)壓縮到2MB,超過Google研究團隊的壓縮性能。
在NEC Labs專攻計算機視覺基礎(chǔ)技術(shù)研究,在Snap研究手機端的消費級AI功能,雖然兩個地方做的事兒都讓王孝宇充滿干勁,但他明白,這并不是自己內(nèi)心真正想要的。
“這次我回國加入云天勵飛,就是想讓AI更直接地為傳統(tǒng)行業(yè)賦能,這里我需要強調(diào)下‘ 更直接’。”
“我選擇人工智能公司的標準是,在業(yè)務(wù)上腳踏實地,在服務(wù)模式上和行業(yè)結(jié)合緊密。這家公司要懂得如何做行業(yè)解決方案,而不是單純的人工智能技術(shù)提供商,只做人工智能這一單點技術(shù)?!?br/>
云天勵飛是一家很To B、更加注重實際落地的智能安防解決方案商,相反,王孝宇的基礎(chǔ)研究和消費級AI研究背景,與新東家所做的事有些不同,這時候往往會遇到水土不服的問題。
此前筆者與美的人工智能研究所所長俞大海交流時,安防出身的他談到消費級和企業(yè)級人臉識別產(chǎn)品的算法、軟硬件方案,幾乎可以用“完全不同”四字形容。消費級產(chǎn)品是以用戶體驗為主,而企業(yè)級產(chǎn)品更多講究的是功能實現(xiàn)。
在研究側(cè)重點和客戶需求迥異的情況下,王孝宇卻并不擔心。
“05年到08年期間,我本人就已經(jīng)在安防領(lǐng)域創(chuàng)業(yè),公司叫創(chuàng)世科技。這三年間,我不僅熟悉了安防業(yè)務(wù)的流程,也深諳行業(yè)痛點,所以基本上不存在行業(yè)水土不服的問題?!?/p>
隨后,他繼續(xù)補充道,過去由于智能攝像頭架設(shè)數(shù)量有限,客戶方往往看重安防解決方案的準確性,對速度的要求并不嚴格。但近兩年隨著各家頂尖供應商識別精度差異越來越小,智能攝像頭覆蓋數(shù)呈指數(shù)級增多,前端設(shè)備的處理速度成為了重要的比拼點。
目前云天勵飛在深圳龍崗區(qū)架設(shè)了3000多路智能攝像頭,在全國有6500+多路部署,這些攝像頭都需要大量的視頻處理能力,如果未來當規(guī)模達到數(shù)萬甚至幾十萬路級時,更需要強大的前端強大的分析能力,快速反饋結(jié)果,并降低服務(wù)器端的壓力。
“過去大家都在拼性能,但算法的壁壘會越來越低,到那個時候相差百分之幾的數(shù)字比拼本質(zhì)上并沒多大差別,真正的差別在于誰的算法能在嵌入式端和大規(guī)模數(shù)據(jù)中實時運行?!?/p>
“15年我們創(chuàng)立Snap研究院時,Google等巨頭都把App的AI功能放在云端處理,但是云端成本太高且速度較慢,于是我們決定把它放在手機端。當時團隊做了世界上唯一個運行在兩億手機設(shè)備上的神經(jīng)網(wǎng)絡(luò)系統(tǒng),這套系統(tǒng)可以在幾十毫秒內(nèi)把人臉檢測、識別、分割全部完成,而且功耗很小。其實這些手機端的CV研究經(jīng)驗,很多都可以沿用在攝像頭前端?!?/p>
加入云天勵飛后,王孝宇的第一要務(wù)是對公司的算法和大數(shù)據(jù)進行進一步的規(guī)劃。
“在大數(shù)據(jù)上,我們計劃積攢超過千萬人的數(shù)據(jù)系統(tǒng),增強訓練。算法創(chuàng)新上,我們想讓自己的算法在千萬和億級數(shù)據(jù)集上得到更好的效果,開發(fā)算法自動化系統(tǒng),縮短研發(fā)周期?!?/p>
在人人都談人臉識別率可達99%以上時,某安防集成商高管告訴雷鋒網(wǎng),他們曾使用了兩家計算機視覺公司的人臉識別方案,最終在某個場景中的實戰(zhàn)準確率分別為30%-40%和70%左右,準確率相差百分之四十之多,后者已經(jīng)是行業(yè)頂級水平。
王孝宇指出,這個現(xiàn)象其實就能反映出AI實戰(zhàn)的重要性。
由于實驗室?guī)熘械臄?shù)據(jù)量較小,產(chǎn)品單一,模型訓練相對簡單,因此能夠達到很高的精度。研究者們能夠輕而易舉在LFW中取得非常可觀的成績,主要因為LFW僅有一萬數(shù)據(jù)量。但在實際應用場景下,方案商面臨的底庫完全能夠達到幾百萬、幾千甚至上億人級,精度會立馬下降。
而且在安防實戰(zhàn)動態(tài)底庫數(shù)據(jù)比拼當中,各家公司完全不在同一起跑線上。
除了底庫外,復雜的應用場景,如遠距離、夜晚、側(cè)臉、逆光等環(huán)境都會對識別影響很大。
“我認為半年到一年以后,絕大部分公司的算法和性能都可能處于同一條起跑線上。但技術(shù)領(lǐng)域有個規(guī)律,當A條件成熟之后,就會對B條件產(chǎn)生新的要求?!?/p>
如馬斯洛需求理論把人類的需求,像階梯一樣從低到高按層次分為五種并層層遞進一樣,科技這一行,客戶對供應商的技術(shù)要求也會隨著低層需求的滿足,從而對其他條件提出更高的要求。
“性能和速度之后,就是智能攝像頭硬件的比拼,尤其是硬件價格的比拼。”
“同樣的算法、同樣的精度、同樣強大的處理能力,有人只需要1萬塊的硬件就能架設(shè)完,而有人可能得花費10萬。雖然近些年算法方案的價格戰(zhàn)屢見不鮮,但更殘酷的硬件價格戰(zhàn)正在來臨?!?/p>
寒冬將至之際,云天勵飛也在這個關(guān)鍵節(jié)點發(fā)布全新產(chǎn)品IFBOX V3.0,可應用于傳統(tǒng)攝像頭改造,硬件產(chǎn)品二次開發(fā)等。該產(chǎn)品采用嵌入式設(shè)計CPU+DSP架構(gòu),提供較高性價比的視頻圖像處理及人臉識別解決方案,最高支持到每秒50+人臉抓拍,15+個人臉特征值提取;數(shù)據(jù)庫最高可以支持超過20W,并實現(xiàn)每秒15+個人臉的數(shù)據(jù)庫對比。
目前云天勵飛也已聚集了一個40多人的團隊研發(fā)AI芯片,并將于明年生產(chǎn)投片,為客戶提供“芯片+算法+數(shù)據(jù)+應用+服務(wù)”端到端的整體解決方案,全面進入備戰(zhàn)狀態(tài)。
一邊為安防“硬”戰(zhàn)籌備糧草,云天勵飛一邊也在探索安防之外的場景。
安防中可以標識人身份的有兩種重要信息:人臉和車。
王孝宇談到,為了更全面的掌握“人”的信息,除了老本行對“人”的檢測和識別外,云天勵飛接下來最有可能做的事情將圍繞車來展開,完成在各種復雜環(huán)境下對每一輛車的識別等。
“但我們也不得不考慮另外一個問題,當無人車普及后,私家車更多會以共享的形式出現(xiàn),這時候車輛信息在人身份中扮演的角色權(quán)重就會下降。因此我們需要提前預判新的場景,并籌備新的解決方案:當用戶進入共享無人車時,這時需要攝像頭來捕捉到進入車的人是誰,汽車端的監(jiān)控方案會成為必需品。"
做解決方案得隨時考慮未來可能發(fā)生的狀態(tài),隨著場景的改變,很多應用也會隨之改變,王孝宇總結(jié)到。
隨后他又談到基于監(jiān)控攝像頭的新應用。
眾所周知,互聯(lián)網(wǎng)是收集用戶線上行為數(shù)據(jù)、構(gòu)建人用戶畫像的重要平臺,而用戶線下的行為數(shù)據(jù)卻很難采集。
這時候,安裝在城市中的億萬個攝像頭將會成為構(gòu)建人線下用戶畫像的新平臺。
云天勵飛希望通過對城市用戶畫像,挖掘這中間的數(shù)據(jù)附加值。
“我在Snap也有做過相關(guān)的研究,我們在這方面的技術(shù)能力全球領(lǐng)先?!?/p>
除此之外,云天勵飛的新研究團隊具有廣泛的AI技術(shù)研發(fā)實力,如醫(yī)學影像和無人車等,但有些傳統(tǒng)行業(yè)的數(shù)據(jù)壁壘和商業(yè)壁壘比技術(shù)壁壘更高,還處于戰(zhàn)略調(diào)研階段。
“云天勵飛選擇進入某個行業(yè)比較慎重,得深入調(diào)研我們團隊對這個行業(yè)有沒有一個好的思路,好的積累。等到對商業(yè)模式有充分把握后,再去用技術(shù)實現(xiàn)。”
確實,過去人工智能企業(yè)野蠻生長時期,商業(yè)模式很容易被技術(shù)誤導。
微軟亞洲研究院副院長張益肇曾告訴雷鋒網(wǎng),很多AI創(chuàng)業(yè)者們在切入某個場景時,既沒捋順流程,也沒想清模式。單純覺得我有AI技術(shù),有幾個合作伙伴,就能大干一場。
于是技術(shù)先行,在沒認清自己,想好業(yè)務(wù)時,直接用人工智能去撬動整個行業(yè)。
好者,在碰的鼻青臉腫后吸取經(jīng)驗不斷保持商業(yè)模式和產(chǎn)品的迭代,最終走對路;壞者,一蹶不振。
雖然前者“精益創(chuàng)業(yè)”式的產(chǎn)品開發(fā)手段在移動互聯(lián)網(wǎng)時代被互聯(lián)網(wǎng)界熱捧,但在企業(yè)級產(chǎn)品中,這種方式并不是所有公司、投資方和員工能承受得起的。
“我們相對屬于保守派吧,AI技術(shù)的擁有者得對傳統(tǒng)行業(yè)抱有敬畏之心?!蓖跣⒂钚χf道。
作為有著優(yōu)秀實驗室背景的研究者,王孝宇還有一項重要任務(wù)是在美國西雅圖建立AI Lab,專注做更加前沿的工作。
過去云天勵飛圍繞業(yè)務(wù)創(chuàng)立了應用機器學習組和機器學習框架組,探討如何搭建更好的框架,更高效地做訓練,更高效地采集數(shù)據(jù),更直觀地做可視化,滿足公司幾個月內(nèi)的技術(shù)需求。
“AI Lab主要聚焦在6個月到2年內(nèi)的前瞻性研究,很多時候,當你鉆進一個很細的應用之后,不站在外面看問題,很難看到更多改進的空間,我們非常需要有這樣一群人去看6個月到2年后的技術(shù)走向?!?span style="color: #FFFFFF;">雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。