號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”的瀚思今天 B 輪融資，它的關(guān)鍵詞卻是人工智能

本文作者：李勤

2017-07-25 14:29

導(dǎo)語(yǔ)：高瀚昭認(rèn)為，人工智能的方法作為手段之一，可以將大數(shù)據(jù)抽絲剝繭，實(shí)現(xiàn)讓安全可見(jiàn)、可視、可控的安全智能。

7月 25 日，號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”瀚思科技（HanSight，以下簡(jiǎn)稱(chēng)瀚思）舉辦了 B 輪融資發(fā)布會(huì)，宣布獲得1億元人民幣融資，本輪融資由國(guó)科嘉和基金和 IDG 資本領(lǐng)投，南京高科等 A 輪投資方繼續(xù)跟投。

事實(shí)上，7月17日，在中關(guān)村軟件園的瀚思公司的一個(gè)會(huì)議室中， CEO 高瀚昭和聯(lián)合創(chuàng)始人董昕面對(duì)雷鋒網(wǎng)等十幾家媒體，已經(jīng)提前宣布了融資的事，但那天，他倆提到的主要關(guān)鍵詞卻是人工智能與安全。

瀚思成立于 2014 年，該公司的創(chuàng)始團(tuán)隊(duì)認(rèn)為，傳統(tǒng)以防御為核心的安全策略已經(jīng)過(guò)時(shí)，信息安全正在變成一個(gè)大數(shù)據(jù)分析問(wèn)題，大規(guī)模的安全數(shù)據(jù)需要被有效地關(guān)聯(lián)、分析和挖掘。

高瀚昭認(rèn)為，人工智能的方法作為手段之一，可以將大數(shù)據(jù)抽絲剝繭，實(shí)現(xiàn)讓安全可見(jiàn)、可知、可控的安全智能。

直白地說(shuō)，以數(shù)據(jù)驅(qū)動(dòng)安全的瀚思認(rèn)為，要達(dá)到上述目標(biāo)，需要具備三個(gè)能力：第一，要有平臺(tái)搜集數(shù)據(jù)；第二，要有能力分析哪些數(shù)據(jù)可以深挖安全風(fēng)險(xiǎn)；第三，針對(duì)不同業(yè)務(wù)場(chǎng)景與數(shù)據(jù)，面臨不同情況，基于機(jī)器學(xué)習(xí)和人工智能，能做出不同的處置方式。

所謂“數(shù)據(jù)驅(qū)動(dòng)安全”，最關(guān)鍵的還是“安全”，也因此，雷鋒網(wǎng)曾問(wèn)過(guò)一些安全企業(yè)，你們都說(shuō)要做反欺詐，要做安全，要搞數(shù)據(jù)分析，你們的數(shù)據(jù)從哪里來(lái)？

一部分人什么都要，什么都做，干脆數(shù)據(jù)也自己搞，一部分人不想陷入與以“大數(shù)據(jù)”為定位的數(shù)據(jù)公司的競(jìng)爭(zhēng)中，或者說(shuō)，這也不是他們的優(yōu)勢(shì)，所以選擇了與數(shù)據(jù)公司合作，自己再駐扎到客戶(hù)中，客戶(hù)給什么數(shù)據(jù)，他們分析什么數(shù)據(jù)。

瀚思雖然號(hào)稱(chēng)為“大數(shù)據(jù)安全公司”，他們并不走第一條路，暫時(shí)也沒(méi)有和數(shù)據(jù)公司合作，他們選擇了只分析客戶(hù)的數(shù)據(jù)，一來(lái)解決了搜集數(shù)據(jù)的難題，二來(lái)將火力集中在第二個(gè)和第三個(gè)能力上——即搞清楚哪些數(shù)據(jù)可以深挖安全風(fēng)險(xiǎn)，又有哪些處置方式可以應(yīng)對(duì)。

不過(guò)，有意思的是，瀚思的兩位核心技術(shù)主導(dǎo)者——?jiǎng)?chuàng)始人高瀚昭和首席科學(xué)家萬(wàn)曉川雖然都在著名的趨勢(shì)科技公司工作十幾年，曾帶領(lǐng)團(tuán)隊(duì)研發(fā)了基于沙箱的檢測(cè)技術(shù)和防御產(chǎn)品，但瀚思決絕地和沙箱技術(shù)告了別。

即使這兩位核心技術(shù)人員曾在沙箱產(chǎn)品上于 2013 年擊敗了 FireEye 的同類(lèi)產(chǎn)品，但你要允許技術(shù)者勇于否定自己過(guò)去引以為傲的成果。

董昕的原話(huà)是這樣的：

“與殺毒引擎相對(duì)應(yīng)的一系列安全產(chǎn)品，比如沙箱，F(xiàn)ireEye 在前幾年一直推崇這么一個(gè)東西，它也在一定程度上可以發(fā)現(xiàn)一系列的未知病毒或者惡意文件。它的做法是讓這個(gè)文件在一個(gè)虛擬機(jī)中執(zhí)行一下，跑起來(lái)看看有沒(méi)有惡意的行為，比如修改注冊(cè)表、訪問(wèn)一些不該訪問(wèn)的網(wǎng)站、試圖記錄鍵盤(pán)敲擊等，從而判斷文件到底是惡意的還是非惡意的。

但是，類(lèi)似沙箱的一個(gè)重大的缺陷是，畢竟運(yùn)營(yíng)在虛擬機(jī)里，實(shí)際運(yùn)行性能非常差，幾分鐘才能跑出一條結(jié)果。而我們目前用的深度學(xué)習(xí)技術(shù)，不需執(zhí)行任何文件，也就是說(shuō)——一個(gè)二進(jìn)制文件可以直接以0和1的二進(jìn)制碼的形式，輸入給機(jī)器，機(jī)器再自動(dòng)判斷到底是惡意還是不是惡意的?！?/p>

李飛飛曾在 TED 的演講臺(tái)上稱(chēng)，給出了 62000張貓的圖片，機(jī)器能否在下一張時(shí)，判斷出圖片上的是不是一只貓？董昕一聽(tīng)，很有認(rèn)同感——如果認(rèn)識(shí)了 62000 個(gè)病毒、當(dāng)?shù)?62001 個(gè)文件出現(xiàn)時(shí)，我們能不能自動(dòng)判斷它是否是惡意文件？

號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”的瀚思今天 B 輪融資，它的關(guān)鍵詞卻是人工智能

貓還是長(zhǎng)成那樣的貓，病毒卻不一定是以前的病毒。

于是，他們捋出了一條思路：靠識(shí)別圖像的方式來(lái)識(shí)別每個(gè)二進(jìn)制的文件，在海量的 GPU 集群里實(shí)現(xiàn)對(duì)上千萬(wàn)樣本的學(xué)習(xí)，形成了一整套模型，從而靠深度學(xué)習(xí)的模型來(lái)識(shí)別新的、未知的文件，“有99%的置信區(qū)間來(lái)判斷它到底是不是惡意”。

然后，瀚思火速地將這套技術(shù)落地為“DeepSense Beta（深感）”引擎，并稱(chēng)其速度比沙箱快10倍，3 個(gè)月內(nèi)不更新可以保持 90 %的檢測(cè)率。

將已經(jīng)訓(xùn)練的圖像識(shí)別、人臉識(shí)別或者圖像識(shí)別的模型遷移到二進(jìn)制的圖點(diǎn)后，董昕稱(chēng)，花了很多錢(qián)，燒了很多電，用了很長(zhǎng)時(shí)間進(jìn)行模型訓(xùn)練，平均訓(xùn)練出一個(gè)模型可能至少需要一個(gè)月甚至幾個(gè)月。訓(xùn)練出模型后通過(guò)部署瀚思的流量檢測(cè)設(shè)備，就可以實(shí)時(shí)地從企業(yè)外聯(lián)的網(wǎng)絡(luò)端口將文件抽取二進(jìn)制的文件，跑到模型里進(jìn)行優(yōu)化檢測(cè)，如果發(fā)現(xiàn)異常，就會(huì)告警。

隨后，瀚思順理成章地將深感引擎+流量監(jiān)測(cè)設(shè)備結(jié)合成了一款萬(wàn)兆網(wǎng)絡(luò)流量智能分析引擎（瀚思 NTA 網(wǎng)絡(luò)流量分析）。

號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”的瀚思今天 B 輪融資，它的關(guān)鍵詞卻是人工智能

這種部署代價(jià)比較低。因?yàn)椴恍枰兕~外裝一系列的終端殺毒軟件，也不需要裝非常重的探針，只需要在客戶(hù)網(wǎng)絡(luò)側(cè)部署流量采集設(shè)備。

將整個(gè)網(wǎng)絡(luò)以包的形式進(jìn)行截取、存儲(chǔ)、還原，而且是長(zhǎng)周期，比如以月計(jì)、以日計(jì)算，而不像以前只是實(shí)時(shí)地檢測(cè)某一個(gè)高峰。這樣的好處是，可以嵌入更復(fù)雜的機(jī)器學(xué)習(xí)和模型，從而發(fā)現(xiàn)更難以挖掘的一系列網(wǎng)絡(luò)攻擊或者是危險(xiǎn)行為。

董昕對(duì)雷鋒網(wǎng)介紹，在實(shí)際的業(yè)務(wù)場(chǎng)景中，NTA 在企業(yè)網(wǎng)絡(luò)中一路“通關(guān)而上”，從 DNS 解析?直到 HTTP 下載?件內(nèi)容均可實(shí)時(shí)看到，這樣做的好處是，時(shí)刻有一雙眼睛盯著，狠辣地發(fā)現(xiàn)每一條疑似威脅的線(xiàn)索。隨時(shí)檢測(cè)惡意程序和異常流量，一旦發(fā)現(xiàn)有什么不對(duì)勁，事后還原、檢索任意時(shí)間點(diǎn)的傳輸現(xiàn)場(chǎng)。

在宣布獲得 B 輪融資時(shí)，瀚思推出了新一代 HanSight Enterprise3，除了上述的各類(lèi)引擎，HanSight Enterprise3 疊加了分析編程語(yǔ)言HAL HanSight Analysis Language ，即提供用戶(hù)一個(gè)編程工具，通過(guò)腳本、交互的分析方式直接進(jìn)行分析引擎的操作，且開(kāi)始逐步支撐自然語(yǔ)言處理。

大概就是一個(gè)這樣的場(chǎng)景：

安全人員大吼一聲：過(guò)去 24 小時(shí)，有什么人意圖不軌？
引擎從海量數(shù)據(jù)中檢索，將統(tǒng)計(jì)結(jié)果一一呈上。

此外，HanSight Enterprise3 集成了用戶(hù)與行為智能安全分析引擎，發(fā)現(xiàn)企業(yè)最不愛(ài)說(shuō)又受傷很深的“內(nèi)鬼”行為。

比如，一個(gè)員工在刷了公司的門(mén)禁卡后很快就開(kāi)始連公司的虛擬專(zhuān)用網(wǎng)絡(luò)。

這兩個(gè)過(guò)程分別來(lái)看都是正常的。但是有邏輯問(wèn)題：在企業(yè)的內(nèi)部，員工不需要連接虛擬專(zhuān)用網(wǎng)絡(luò)，直接登錄企業(yè)內(nèi)網(wǎng)即可，所以，這有可能是一次密碼盜用情況。

至此，瀚思完整地闡述了他們?cè)凇暗诙€(gè)能力”和“第三個(gè)能力”上的建設(shè)。

不過(guò)，在第三個(gè)能力，即面臨不同情況，基于機(jī)器學(xué)習(xí)和人工智能能做出不同的處置方式上，可能目前大家印象最深刻的機(jī)器能做到的還是拒絕、放行或者拉小黑屋的幾種操作。

機(jī)器學(xué)習(xí)和人工智能未來(lái)能否真的成為“智能守衛(wèi)者”，也是“智能安全”探索的答案。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

3人收藏

相關(guān)文章

李勤

編輯、作者

跟蹤互聯(lián)網(wǎng)安全、黑客、極客。微信：qinqin0511。

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門(mén)文章

號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”的瀚思今天 B 輪融資，它的關(guān)鍵詞卻是人工智能

號(hào)稱(chēng)“中國(guó)第一家大數(shù)據(jù)安全公司”的瀚思今天 B 輪融資，它的關(guān)鍵詞卻是人工智能