1
如今,安全領域是機器學習(Machine learning)正在大力進軍的一個方向。
| 把機器學習應用到安全領域,老板們躍躍欲試
如果你親自參加了 2016 RSA 大會,就會發(fā)現(xiàn)幾乎沒有哪家公司在說自家安全領域的產品時,不提及機器學習。這是為什么呢?
可能對外行人來說,機器學習就像一種魔法,能解決所有的安全問題:你把一堆未標識的數據統(tǒng)統(tǒng)塞進會機器學習的系統(tǒng)中,它就能分辨出連人類專家都分辨不出的數據規(guī)律,并且還可以學習新的行為指令和適應環(huán)境威脅。不僅如此,就連為規(guī)則加密也勞煩不到你,因為系統(tǒng)已經自動為你搞定這一切。
要真是像這樣的話,那機器學習可真就是今年的重頭戲了!但諷刺的是,每個人都興師動眾說要在這個領域搞出點名堂來,但真正理解什么是機器學習,或明白機器學習到底能用來做什么的人,卻是鳳毛麟角??上攵?,在這種大環(huán)境下機器學習大多是被濫用的,尤其在安全領域。
| 用機器學習有效解決安全問題,正確的方法是?
把機器學習應用到安全領域,大多會涉及到一種技術——異常檢測(anomaly detection),它可以識別哪些部分和預期模式或數據集不匹配。但技術銷售方要注意,這種技術只在某些條件下有效——不過顯然,他們還不知道自己已經犯下錯誤:他們會告訴你,分析過你公司的網絡流量后,就可以用機器學習 揪出暗藏在網絡中的黑客。但事實上,機器學習根本就做不到。這時候,你要立刻對這個銷售商保持一絲懷疑。
那到底什么情況下才有效?答案是,只有為低維度的問題也配備上高質量的標識數據,這樣的機器學習才是有效的。但很不幸,企業(yè)在實施過程并沒有做到這一點。如果要檢測新型的攻擊方式,你得有很清晰并且經過標識的攻擊案例。這就是說,如果沒有透徹理解正常的網絡行為,機器學習是不可能發(fā)現(xiàn)黑客的。再說,所有的黑客都很狡猾,他們一定會把自己偽裝的天衣無縫。
| 機器學習和異常檢測,用在哪里價值最大?
機器學習和異常檢測真正有用的地方,在于它們能將人類行為分類。
事實證明,人類的預測能力非常強,他們也有能力建立非常精確的個體用戶行為模型,讓模型探測到異常情況。
其實,人們在這方面已小有成就,比如隱式認證( Implicit Authentication)。隱式認證采用生物特征識別技術,基于擊鍵力度、節(jié)奏和打字模式等技術對用戶身份進行認證。不管是改善用戶體驗還是增強安全性,這個技術的優(yōu)勢都相當明顯。最起碼,它免除了用戶記憶密碼的負擔和輸入密碼的麻煩。由于隱式認證所需元素大多是低維的, 機器學習就只需處理少量幾個參數,這也使得收集用戶的高品質標識數據變得很方便。所以,即使有行為差異或信號干擾, 機器學習還是能正確為計算機視覺進行圖形搭配。同理,機器學習也能通過識別出個體的獨特行為而進行身份驗證,這當然也不在話下。
不過,它是怎么做到的呢?
其實,你走路、站立等所有動作,是由眾多因素共同決定的,比如生理狀況,年齡,性別,肌肉記憶等等。并且對個體來說,這些動作不會有太大改變。因此,不經意間,你口袋中的手機就通過內置傳感器精確捕捉到了這些信息,并記錄下來。而想要通過運動行為來識別一個人, 4 秒的運動信息就已足夠。另外,通過對比用戶的歷史和當下的定位記錄也可以進行身份識別。人們總是生活在各種各樣的習慣當中,通過觀察他們什么時候從哪出發(fā),就能預測被測者到底是不是用戶本人。
我們的手機和電腦上已有大量的傳感器,以后隨著可穿戴設備的普及和物聯(lián)網的發(fā)展,傳感器的數量更會暴增。用戶大量的行為數據和環(huán)境數據就這樣被收集起來,提供給機器學習,讓它為用戶建立個體模型,并找到各個因素之間的相互關系。
| 讓機器學習進行安全防護,你需要做哪些功課?
想進行安全防護,就必須讓你的系統(tǒng)提前知道都存在哪些威脅模型。
首先,也是最重要的事——收集數據。這些數據必須非常精確,才能用來訓練系統(tǒng),起到抵抗威脅的作用。不過身份認證系統(tǒng)要真是遭到攻擊,你也不用過于擔心。因為行為變化還是比較好檢測的,系統(tǒng)很快就能識別出異常情況。比如,如果一個設備不小心被偷,那么這個設備被偷之后所記錄的運動狀態(tài),地理位置和用法就會和之前的記錄有明顯不同。不過,系統(tǒng)是接受這種可能存在的異常情況的,這時候用戶就需要在系統(tǒng)上以另外的方式確認身份,調整系統(tǒng),以使假陽性最小化。而一旦我們在不同設備上連接起 4 個因素,那么隱式認證的假陽性就會低于 0.001% 。
這個世界上并沒有哪一種機器學習真的神奇到能解決所有的安全問題。設計者想用機器學習創(chuàng)建一個有用的安全防衛(wèi)產品,就需要對底層系統(tǒng)有深刻理解,并且承認很多問題并不適合用機器學習來解決。不過不用擔心,那些處在浪潮之巔的科技公司會將這些問題一步步消滅掉。
機器學習正在安全領域醞釀著一股勢不可擋的市場狂潮。
via:venturebeat
延伸閱讀:
Human-like learning在對話機器人中的魔性運用
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。