京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

本文作者：郭佳

2017-12-24 11:19

導(dǎo)語：擁有大數(shù)據(jù)和場景應(yīng)用優(yōu)勢的京東，將如何發(fā)揮 AI 在安全方面的作用？

無人機(jī)送貨、叮咚家庭助手、智慧物流、智慧供應(yīng)鏈……近兩年，主打“技術(shù)開啟商業(yè)智能化”概念的京東，落地了眾多相關(guān)產(chǎn)品和實(shí)際應(yīng)用，其中大數(shù)據(jù)成為重要的助推力。

當(dāng)大數(shù)據(jù)滲透到越來越多的智能應(yīng)用場景中時，安全的重要性不言而喻。比如，給我送貨的無人機(jī)會被劫持嗎？叮咚會不會被黑客利用花我的錢為他買東西？在12月21日舉行的京東安全峰會中，來自京東硅谷研發(fā)中心安全實(shí)驗室的架構(gòu)師楊錦，對網(wǎng)絡(luò)安全攻防雙方使用 AI 的情況與應(yīng)用，進(jìn)行了講解。

楊錦此前曾在安全公司 FireEye 和谷歌都有過工作經(jīng)歷，她為何選擇加盟京東？目前 AI 在攻防對抗中是一個怎樣的狀況？京東安全未來將在何處發(fā)力？在演講之后，她接受了雷鋒網(wǎng)的獨(dú)家專訪。

為何棄谷歌，選京東

隨著近年來安全事件的頻發(fā)，中國各大互聯(lián)網(wǎng)公司都在滿世界挖人。

此前，雷鋒網(wǎng)就報道過硅谷安全教父弓峰敏加盟滴滴的消息，其中提到弓峰敏團(tuán)隊加盟原因，正是看上了滴滴所能提供的“大數(shù)據(jù)集”。

其團(tuán)隊的技術(shù)要求與業(yè)務(wù)數(shù)據(jù)密切交互，而利用滴滴的框架和資源，團(tuán)隊能更方便地去展開技術(shù)研究。

“擁有大數(shù)據(jù)”這個理由，同樣也是楊錦加入京東的原因之一。

京東目前有 2 億多的活躍用戶，16 萬第三方賣家，每天能產(chǎn)生 20 Petabytes的數(shù)據(jù)，這個數(shù)據(jù)無論從數(shù)量還是質(zhì)量上來說，都很吸引人。

楊錦告訴雷鋒網(wǎng)，海量精準(zhǔn)的大數(shù)據(jù)和豐富明確的應(yīng)用場景，是 AI 在安全產(chǎn)生價值的兩個重要條件。無論是語音交互、圖像感知還是自然語言識別，其實(shí)都是通過機(jī)器對于大數(shù)據(jù)的學(xué)習(xí)。

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

與此同時，目前京東的智能音箱、無人車、無人機(jī)、智能供應(yīng)鏈等新技術(shù)和產(chǎn)品也提供了明確的應(yīng)用場景，這對于搞安全的人來說，非常有吸引力。

與國內(nèi)近兩年興起的“安全熱”不同，由于美國的互聯(lián)網(wǎng)公司起步較早，遭受網(wǎng)絡(luò)攻擊的“經(jīng)驗”也多，多年來對網(wǎng)絡(luò)安全都非常重視，積累了很多安全人才。楊錦說，在硅谷做安全很多就是中國人。從這點(diǎn)來說，隨著國內(nèi)互聯(lián)網(wǎng)公司的快速發(fā)展，去硅谷“挖人”的也越來越多。

與此同時，由于國內(nèi)龐大的市場和豐富的應(yīng)用數(shù)據(jù)，尤其是人工智能方面的飛速發(fā)展，安全研究人員在這片“土壤”中，也能挖掘出更多 AI 安全的價值。

攻擊者對 AI 運(yùn)用得 666

人工智能在攻防對抗中究竟處于什么階段？在峰會現(xiàn)場，楊錦以一個簡歷網(wǎng)站的反爬蟲為例，講了安全人員同黑產(chǎn)過招的幾個回合。

對于基礎(chǔ)的爬蟲行為，安全人員先開始只看對方的 IP、請求量、User Agent（用戶代理，簡稱 UA，是一個特殊字符串頭，使得服務(wù)器能夠識別用戶使用的操作系統(tǒng)及版本、CPU 類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言等信息），根據(jù)這三個特征制定規(guī)則，封掉異常行為。

黑產(chǎn)在判斷出這些簡單的防守規(guī)則后，改變了進(jìn)攻套路。把 User Agent 偽裝成正常的百度爬蟲，讓防守方無法識別，并且通過 IP 代理的方式進(jìn)行下一步的爬取。

接下來安全人員開始用頻率進(jìn)行限制去攔截異常行為，并且寫了一個小腳本來把白名單加進(jìn)去，來判斷爬蟲是不是來自百度的服務(wù)器。

隨著防守方的規(guī)則變化，黑產(chǎn)也繼續(xù)出新招，運(yùn)用云端多IP的能力進(jìn)行無規(guī)律的隨機(jī)慢爬，從而規(guī)避掉之前用頻率做防守的規(guī)則。

要防黑產(chǎn)這招，可能導(dǎo)致防守方對正常用戶的“誤殺”。所以防守方干脆推一個驗證碼，來識別你到底是人還是機(jī)器在做爬取的工作，但在這方面黑產(chǎn)也有相應(yīng)的對策。

對于驗證碼的識別，雷鋒網(wǎng)此前也報道過一秒分辨出楊臣剛、王大治和孫楠，這個黑產(chǎn)居然用AI 來"打碼"，當(dāng) AI 賦能黑產(chǎn)，智能爬蟲的威力也顯現(xiàn)出來。據(jù)楊錦透露，這些打碼平臺識別一次驗證碼的收費(fèi)大概在0.15分左右，但有的打碼平臺在被端掉之前的 3 個月內(nèi)做過 250 多億次的識別，收入可觀。

在攻防對抗快速升級的情況下，今天行之有效的防守措施，可能明天就失效了，沒有一種簡單方式是能夠一招制敵的。楊錦認(rèn)為，對于防守方來說，未來使用 AI 深度學(xué)習(xí)的策略和框架，可以對攻擊行為進(jìn)行全方位的識別，以至于達(dá)到實(shí)時辨別和封殺的效果。

安全人員怎么辦

在演講現(xiàn)場，楊錦重點(diǎn)提到去年 DARPA 舉辦的一場 CGC 比賽，雷鋒網(wǎng)此前也進(jìn)行過報道走近首屆DARPA網(wǎng)絡(luò)安全大賽，其展現(xiàn)了基于AI的攻防對抗的，揭示出未來安全極有可能是攻防機(jī)器人之間利用AI的自主自動對抗。

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

簡單來說就是機(jī)器之間的CTF比賽，AI VS AI，通過一系列的可視化指標(biāo)，機(jī)器展示了在快速識別和利用對手的弱點(diǎn)的同時，發(fā)現(xiàn)并修補(bǔ)有缺陷的代碼的能力。除了機(jī)器人之間的比賽，此后冠軍隊的 Mayhem 系統(tǒng)還參加了與真人戰(zhàn)隊的CTF比賽。

雖然在最后人機(jī)混合的CTF比賽，冠軍是由真人戰(zhàn)隊 CMU PPP 獲得，不過由 CMU PPP 主力參與開發(fā)的機(jī)器人 Mayhem 在比賽中還是打敗了其他幾支真人隊伍。

這次CGC比賽歐美安全圈引起的震動非常大，很多新聞媒體的報告都是以未來機(jī)器人是否能代替安全研究人員為焦點(diǎn)討論。

楊錦告訴雷鋒網(wǎng)，真正了解安全且能夠合理運(yùn)用AI技術(shù)的安全研究人員，將有能力建造強(qiáng)大的機(jī)器系統(tǒng)，這才是AI安全威力升級關(guān)鍵所在，也是安全人員的事業(yè)發(fā)展方向。

AI安全在京東

由于AI技術(shù)對于攻防雙方來說都是新的賦能，如果不重視 AI 在防守方的發(fā)展，攻擊方在AI方面的進(jìn)展會造成全新的威脅，而這些新威脅卻是傳統(tǒng)安全手段完全無法防范的。

在這種情況下，楊錦透露，AI安全已經(jīng)成為京東安全重點(diǎn)發(fā)力的方向，目前主要在京東硅谷安全實(shí)驗室開展。

京東安全不同于 BAT 安全，由于有著充分大量的 B2C 情景，需要重視B端風(fēng)險。不同于傳統(tǒng)安全，AI安全關(guān)注京東新零售情景下的各項業(yè)務(wù)，以及IOT發(fā)展中的綜合風(fēng)險問題，強(qiáng)調(diào)采用系統(tǒng)觀點(diǎn)，使AI技術(shù)與業(yè)務(wù)安全深入結(jié)合，為業(yè)務(wù)健康開展保駕護(hù)航。

AI安全的原理是，正常業(yè)務(wù)或內(nèi)外部的技術(shù)行為都會留下數(shù)據(jù)信息痕跡，利用這些信息痕跡，采用AI等分析手段，可以揭示出數(shù)據(jù)背后的客觀事實(shí)，消除風(fēng)險，對抗來自對手的AI攻擊。

楊錦所講的例子其實(shí)換句話說就是，當(dāng) AI 賦能攻擊方時，安全研究人員所面對的挑戰(zhàn)將會非常大。該如何應(yīng)對？她從業(yè)務(wù)安全開始講起。

京東是一個電商平臺，涉及業(yè)務(wù)安全有8個主要流程，用戶的注冊、登錄、實(shí)名認(rèn)證、商品瀏覽、下單、支付、評價和推廣營銷，這些領(lǐng)域都有攻擊方的窺探和攻擊。

以抵抗羊毛黨為例，楊錦和團(tuán)隊會先搜集信息，主要有對黑產(chǎn)的活動監(jiān)控信息，和對內(nèi)部重要數(shù)據(jù)的聯(lián)合打通。通過自然語言理解以及各種聚類算法，抽出重要的信息。

在這個過程中，如何能提供給 AI 切實(shí)有效的數(shù)據(jù)是關(guān)鍵點(diǎn)，這時候同業(yè)務(wù)部門的配合就會非常重要。

在提取出黑產(chǎn)活動的信息后，他們會根據(jù)這些信息進(jìn)行預(yù)警和攔截，在攔截完畢以后，會得到業(yè)務(wù)部門的反饋，此次攔截正確與否，再反饋到數(shù)據(jù)中進(jìn)行打標(biāo)，這時候的數(shù)據(jù)才可以運(yùn)用到 AI 的算法中進(jìn)行深度學(xué)習(xí)。通過這樣的循環(huán)，來提高防守能力，攔截黑產(chǎn)訂單。

相比于人工，這樣可以達(dá)到智能化、完全化和零配制的目的。

楊錦說，類似這樣的方式同樣可以運(yùn)用到防止對公司進(jìn)行整體經(jīng)營情況的窺探和利用。與黑產(chǎn)的相關(guān)的攻防對抗一直在不斷的演進(jìn)當(dāng)中。

寫在最后

今年5月，京東 CEO 劉強(qiáng)東曾在自己的媒體賬號上為即將上市的智能冰箱打 call 。其可通過內(nèi)置雙攝像頭和圖像識別技術(shù)，知道冰箱內(nèi)部的情況，并管理其中的食材，比如提醒食材的有效期，根據(jù)食材推薦食譜，學(xué)習(xí)用戶的飲食和購物習(xí)慣，并提供在京東快速下單購買材料的通道。

對此，財經(jīng)作家吳曉波曾預(yù)言，未來大數(shù)據(jù)將是京東最值錢的資產(chǎn)。

窺一斑而知全豹，智能冰箱的背后，是京東在 AI 和 IOT 等方面的大力布局，當(dāng)互聯(lián)網(wǎng)公司在掌握了用戶、商家、生產(chǎn)等方面的數(shù)據(jù)后，安全也稱為智能化環(huán)節(jié)中重要的一環(huán)。

在采訪楊錦時，她也告訴雷鋒網(wǎng)，目前京東在硅谷的研發(fā)中心、大數(shù)據(jù)、AI、智慧供應(yīng)鏈、平臺產(chǎn)品研發(fā)、智慧物流、安全等部門都在密切協(xié)作， AI 使用于安全，已經(jīng)是一個現(xiàn)實(shí)了，因為攻擊方已經(jīng)在使用各種技術(shù)，防守方也在利用 AI 新的利器，與攻擊方進(jìn)行較量。

部分內(nèi)容來自2017京東安全峰會

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

郭佳

編輯

發(fā)私信

當(dāng)月熱門文章

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

為何棄谷歌，選京東

攻擊者對 AI 運(yùn)用得 666

安全人員怎么辦

AI安全在京東

寫在最后

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

為何棄谷歌，選京東