0
本文作者: 郭佳 | 2017-12-24 11:19 |
無人機(jī)送貨、叮咚家庭助手、智慧物流、智慧供應(yīng)鏈……近兩年,主打“技術(shù)開啟商業(yè)智能化”概念的京東,落地了眾多相關(guān)產(chǎn)品和實(shí)際應(yīng)用,其中大數(shù)據(jù)成為重要的助推力。
當(dāng)大數(shù)據(jù)滲透到越來越多的智能應(yīng)用場景中時,安全的重要性不言而喻。比如,給我送貨的無人機(jī)會被劫持嗎?叮咚會不會被黑客利用花我的錢為他買東西?在12月21日舉行的京東安全峰會中,來自京東硅谷研發(fā)中心安全實(shí)驗室的架構(gòu)師楊錦,對網(wǎng)絡(luò)安全攻防雙方使用 AI 的情況與應(yīng)用,進(jìn)行了講解。
楊錦此前曾在安全公司 FireEye 和谷歌都有過工作經(jīng)歷,她為何選擇加盟京東?目前 AI 在攻防對抗中是一個怎樣的狀況?京東安全未來將在何處發(fā)力?在演講之后,她接受了雷鋒網(wǎng)的獨(dú)家專訪。
隨著近年來安全事件的頻發(fā),中國各大互聯(lián)網(wǎng)公司都在滿世界挖人。
此前,雷鋒網(wǎng)就報道過硅谷安全教父弓峰敏加盟滴滴的消息,其中提到弓峰敏團(tuán)隊加盟原因,正是看上了滴滴所能提供的“大數(shù)據(jù)集”。
其團(tuán)隊的技術(shù)要求與業(yè)務(wù)數(shù)據(jù)密切交互,而利用滴滴的框架和資源,團(tuán)隊能更方便地去展開技術(shù)研究。
“擁有大數(shù)據(jù)”這個理由,同樣也是楊錦加入京東的原因之一。
京東目前有 2 億多的活躍用戶,16 萬第三方賣家,每天能產(chǎn)生 20 Petabytes的數(shù)據(jù),這個數(shù)據(jù)無論從數(shù)量還是質(zhì)量上來說,都很吸引人。
楊錦告訴雷鋒網(wǎng),海量精準(zhǔn)的大數(shù)據(jù)和豐富明確的應(yīng)用場景,是 AI 在安全產(chǎn)生價值的兩個重要條件。無論是語音交互、圖像感知還是自然語言識別,其實(shí)都是通過機(jī)器對于大數(shù)據(jù)的學(xué)習(xí)。
與此同時,目前京東的智能音箱、無人車、無人機(jī)、智能供應(yīng)鏈等新技術(shù)和產(chǎn)品也提供了明確的應(yīng)用場景,這對于搞安全的人來說,非常有吸引力。
與國內(nèi)近兩年興起的“安全熱”不同,由于美國的互聯(lián)網(wǎng)公司起步較早,遭受網(wǎng)絡(luò)攻擊的“經(jīng)驗”也多,多年來對網(wǎng)絡(luò)安全都非常重視,積累了很多安全人才。楊錦說,在硅谷做安全很多就是中國人。從這點(diǎn)來說,隨著國內(nèi)互聯(lián)網(wǎng)公司的快速發(fā)展,去硅谷“挖人”的也越來越多。
與此同時,由于國內(nèi)龐大的市場和豐富的應(yīng)用數(shù)據(jù),尤其是人工智能方面的飛速發(fā)展,安全研究人員在這片“土壤”中,也能挖掘出更多 AI 安全的價值。
人工智能在攻防對抗中究竟處于什么階段?在峰會現(xiàn)場,楊錦以一個簡歷網(wǎng)站的反爬蟲為例,講了安全人員同黑產(chǎn)過招的幾個回合。
對于基礎(chǔ)的爬蟲行為,安全人員先開始只看對方的 IP、請求量、User Agent(用戶代理,簡稱 UA,是一個特殊字符串頭,使得服務(wù)器能夠識別用戶使用的操作系統(tǒng)及版本、CPU 類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言等信息),根據(jù)這三個特征制定規(guī)則,封掉異常行為。
黑產(chǎn)在判斷出這些簡單的防守規(guī)則后,改變了進(jìn)攻套路。把 User Agent 偽裝成正常的百度爬蟲,讓防守方無法識別,并且通過 IP 代理的方式進(jìn)行下一步的爬取。
接下來安全人員開始用頻率進(jìn)行限制去攔截異常行為,并且寫了一個小腳本來把白名單加進(jìn)去,來判斷爬蟲是不是來自百度的服務(wù)器。
隨著防守方的規(guī)則變化,黑產(chǎn)也繼續(xù)出新招,運(yùn)用云端多IP的能力進(jìn)行無規(guī)律的隨機(jī)慢爬,從而規(guī)避掉之前用頻率做防守的規(guī)則。
要防黑產(chǎn)這招,可能導(dǎo)致防守方對正常用戶的“誤殺”。所以防守方干脆推一個驗證碼,來識別你到底是人還是機(jī)器在做爬取的工作,但在這方面黑產(chǎn)也有相應(yīng)的對策。
對于驗證碼的識別,雷鋒網(wǎng)此前也報道過一秒分辨出楊臣剛、王大治和孫楠,這個黑產(chǎn)居然用AI 來"打碼",當(dāng) AI 賦能黑產(chǎn),智能爬蟲的威力也顯現(xiàn)出來。據(jù)楊錦透露,這些打碼平臺識別一次驗證碼的收費(fèi)大概在0.15分左右,但有的打碼平臺在被端掉之前的 3 個月內(nèi)做過 250 多億次的識別,收入可觀。
在攻防對抗快速升級的情況下,今天行之有效的防守措施,可能明天就失效了,沒有一種簡單方式是能夠一招制敵的。楊錦認(rèn)為,對于防守方來說,未來使用 AI 深度學(xué)習(xí)的策略和框架,可以對攻擊行為進(jìn)行全方位的識別,以至于達(dá)到實(shí)時辨別和封殺的效果。
在演講現(xiàn)場,楊錦重點(diǎn)提到去年 DARPA 舉辦的一場 CGC 比賽,雷鋒網(wǎng)此前也進(jìn)行過報道走近首屆DARPA網(wǎng)絡(luò)安全大賽,其展現(xiàn)了基于AI的攻防對抗的,揭示出未來安全極有可能是攻防機(jī)器人之間利用AI的自主自動對抗。
簡單來說就是機(jī)器之間的CTF比賽,AI VS AI,通過一系列的可視化指標(biāo),機(jī)器展示了在快速識別和利用對手的弱點(diǎn)的同時,發(fā)現(xiàn)并修補(bǔ)有缺陷的代碼的能力。除了機(jī)器人之間的比賽,此后冠軍隊的 Mayhem 系統(tǒng)還參加了與真人戰(zhàn)隊的CTF比賽。
雖然在最后人機(jī)混合的CTF比賽,冠軍是由真人戰(zhàn)隊 CMU PPP 獲得,不過由 CMU PPP 主力參與開發(fā)的機(jī)器人 Mayhem 在比賽中還是打敗了其他幾支真人隊伍。
這次CGC比賽歐美安全圈引起的震動非常大,很多新聞媒體的報告都是以未來機(jī)器人是否能代替安全研究人員為焦點(diǎn)討論。
楊錦告訴雷鋒網(wǎng),真正了解安全且能夠合理運(yùn)用AI技術(shù)的安全研究人員,將有能力建造強(qiáng)大的機(jī)器系統(tǒng),這才是AI安全威力升級關(guān)鍵所在,也是安全人員的事業(yè)發(fā)展方向。
由于AI技術(shù)對于攻防雙方來說都是新的賦能,如果不重視 AI 在防守方的發(fā)展,攻擊方在AI方面的進(jìn)展會造成全新的威脅,而這些新威脅卻是傳統(tǒng)安全手段完全無法防范的。
在這種情況下,楊錦透露,AI安全已經(jīng)成為京東安全重點(diǎn)發(fā)力的方向,目前主要在京東硅谷安全實(shí)驗室開展。
京東安全不同于 BAT 安全,由于有著充分大量的 B2C 情景,需要重視B端風(fēng)險。 不同于傳統(tǒng)安全,AI安全關(guān)注京東新零售情景下的各項業(yè)務(wù),以及IOT發(fā)展中的綜合風(fēng)險問題,強(qiáng)調(diào)采用系統(tǒng)觀點(diǎn),使AI技術(shù)與業(yè)務(wù)安全深入結(jié)合,為業(yè)務(wù)健康開展保駕護(hù)航。
AI安全的原理是,正常業(yè)務(wù)或內(nèi)外部的技術(shù)行為都會留下數(shù)據(jù)信息痕跡,利用這些信息痕跡,采用AI等分析手段,可以揭示出數(shù)據(jù)背后的客觀事實(shí),消除風(fēng)險,對抗來自對手的AI攻擊。
楊錦所講的例子其實(shí)換句話說就是,當(dāng) AI 賦能攻擊方時,安全研究人員所面對的挑戰(zhàn)將會非常大。該如何應(yīng)對?她從業(yè)務(wù)安全開始講起。
京東是一個電商平臺,涉及業(yè)務(wù)安全有8個主要流程,用戶的注冊、登錄、實(shí)名認(rèn)證、商品瀏覽、下單、支付、評價和推廣營銷,這些領(lǐng)域都有攻擊方的窺探和攻擊。
以抵抗羊毛黨為例, 楊錦和團(tuán)隊會先搜集信息,主要有對黑產(chǎn)的活動監(jiān)控信息,和對內(nèi)部重要數(shù)據(jù)的聯(lián)合打通。通過自然語言理解以及各種聚類算法,抽出重要的信息。
在這個過程中,如何能提供給 AI 切實(shí)有效的數(shù)據(jù)是關(guān)鍵點(diǎn),這時候同業(yè)務(wù)部門的配合就會非常重要。
在提取出黑產(chǎn)活動的信息后,他們會根據(jù)這些信息進(jìn)行預(yù)警和攔截,在攔截完畢以后,會得到業(yè)務(wù)部門的反饋,此次攔截正確與否,再反饋到數(shù)據(jù)中進(jìn)行打標(biāo),這時候的數(shù)據(jù)才可以運(yùn)用到 AI 的算法中進(jìn)行深度學(xué)習(xí)。通過這樣的循環(huán),來提高防守能力,攔截黑產(chǎn)訂單。
相比于人工,這樣可以達(dá)到智能化、完全化和零配制的目的。
楊錦說,類似這樣的方式同樣可以運(yùn)用到防止對公司進(jìn)行整體經(jīng)營情況的窺探和利用。與黑產(chǎn)的相關(guān)的攻防對抗一直在不斷的演進(jìn)當(dāng)中。
今年5月,京東 CEO 劉強(qiáng)東曾在自己的媒體賬號上為即將上市的智能冰箱打 call 。其可通過內(nèi)置雙攝像頭和圖像識別技術(shù),知道冰箱內(nèi)部的情況,并管理其中的食材,比如提醒食材的有效期,根據(jù)食材推薦食譜,學(xué)習(xí)用戶的飲食和購物習(xí)慣,并提供在京東快速下單購買材料的通道。
對此,財經(jīng)作家吳曉波曾預(yù)言,未來大數(shù)據(jù)將是京東最值錢的資產(chǎn)。
窺一斑而知全豹,智能冰箱的背后,是京東在 AI 和 IOT 等方面的大力布局,當(dāng)互聯(lián)網(wǎng)公司在掌握了用戶、商家、生產(chǎn)等方面的數(shù)據(jù)后,安全也稱為智能化環(huán)節(jié)中重要的一環(huán)。
在采訪楊錦時,她也告訴雷鋒網(wǎng),目前京東在硅谷的研發(fā)中心、大數(shù)據(jù)、AI、智慧供應(yīng)鏈、平臺產(chǎn)品研發(fā)、智慧物流、安全等部門都在密切協(xié)作, AI 使用于安全,已經(jīng)是一個現(xiàn)實(shí)了,因為攻擊方已經(jīng)在使用各種技術(shù),防守方也在利用 AI 新的利器,與攻擊方進(jìn)行較量。
部分內(nèi)容來自2017京東安全峰會
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。