0
本文作者: 叢末 | 2018-12-09 17:17 |
雷鋒網(wǎng) AI 科技評論按:本文作者趙通,是來自美國圣母大學(xué)計算機系 DM2 實驗室的博士生。本文是他為雷鋒網(wǎng) AI 科技評論撰寫的基于 BigData 錄用論文《Actionable Objective Optimization for Suspicious Behavior Detection on Large Bipartite Graphs》的獨家解讀稿件,未經(jīng)許可不得轉(zhuǎn)載。
惡行是可怕的。章瑩穎綁架失蹤案過去了 500 余天,還沒有實質(zhì)進展。2017 年 4 月,未滿 27 歲的北大碩士畢業(yè)生章瑩穎作為訪問學(xué)者前往美國伊利諾伊大學(xué)香檳分校交流學(xué)習(xí)。6 月 9 日下午 2 點,章乘坐公交赴校外公寓簽約,在轉(zhuǎn)站等車時,不慎上了一輛陌生男子的黑色轎車,之后再也沒有人見過她。當晚其好友與教授報警,一直到 6 月 30 日,美國警方拘捕一名白人男子,稱章可能已死亡。7 月 12 日,聯(lián)邦大陪審團正式起訴嫌疑人,到目前為止,此案仍在法庭受理當中。類似的情形在國內(nèi)也時有發(fā)生,「滴滴順風(fēng)車」命案便是血淋淋的悲劇。每每出現(xiàn)在新聞標題里的「又一女孩」或是「三個月內(nèi)第二名乘客」這些字眼,都讓人納悶,究竟是什么讓這類事件一而再、再而三地發(fā)生。惡行不只出現(xiàn)在現(xiàn)實生活中,在網(wǎng)絡(luò)中也無處不在,如在淘寶和 eBay 上就存在買家「霸凌」賣家的行為:買家只需購買賣家的一件便宜商品,即獲得給商品評價、打分的權(quán)利。買家如若無視商品質(zhì)量,打出極低的分數(shù),賣家的平均分數(shù)就會降低,而平臺推薦系統(tǒng)往往根據(jù)評分排行,評分稍微降低一點,都會導(dǎo)致賣家在和其余商家競爭時無法出現(xiàn)在被推薦的第一頁,從而失去生意,最終倒閉。因此買家利用賣家的弱點,可以索要折扣乃至現(xiàn)金等,這就是「霸凌買家」的由來。
在關(guān)注各種案件的同時,我們不得不思考:當我們面臨即將到來的惡行時,我們是否能夠提前防范惡性事件的發(fā)生?越是思考,越是讓人不寒而栗——比起生活上的孤零零,更可怕的是信息的貧瘠與環(huán)境的復(fù)雜。
父母親的一句「注意安全」遇上了「簽訂租約」、「錯過公交」、「遲到誤點」、「校內(nèi)路邊」、「黑色轎車」、「白人男子」、「邀請上車」等陌生環(huán)境下的復(fù)雜情景,都顯得蒼白無力。受害人的判斷力迅速被「準時準點」、「誠實守信」、「文明發(fā)達」、「樂于助人」沖垮。如果這些狀況發(fā)生在她的家鄉(xiāng)福建省南平市,想必她會冷靜很多:太多的事故、故事以及對周遭的了解讓她擁有足夠多的信息去面對復(fù)雜環(huán)境。試想,如果瑩穎曾看過伊利諾伊大學(xué)校園犯罪地圖、聽過一些危險事件的報道,在內(nèi)心里構(gòu)建起一座防范惡行的「防火墻」,她也許會在「簽約誤點」的情況下對「上陌生人的黑色轎車」這一選擇要多加斟酌,從而避免這一悲劇的發(fā)生。一句簡單的「注意安全」,信息量真的是太少了。
圖一:來自 CampusCrime.net:性犯罪、搶劫等惡性事件的校園分布
雖然政府與各方平臺已經(jīng)非常努力地給人民與用戶提供最優(yōu)質(zhì)、最安全的服務(wù),他們卻很難提前對惡行做出有效的防范。因為將好人誤判為壞人的代價是巨大的。試想,當重要郵件被誤扔進了垃圾箱,當一批正常的淘寶用戶被封號,當警方誤逮捕「可疑人員」,這些都必會導(dǎo)致服務(wù)劣質(zhì)化、抱怨四起、平臺收益受損、責(zé)任難以承擔(dān)等諸多負面影響。這就是為什么政府與平臺雖坐擁計算與大數(shù)據(jù)資源,卻顯得反應(yīng)遲鈍、畏首畏尾。不過在責(zé)難平臺的同時,用戶自身也忽略了安全意識的建立,忘記了自己才是最有執(zhí)行力去說「不」的人。
當我們觀察到平臺與用戶之間存在著這條很長很深的信息鴻溝時,圣母大學(xué)計算機系數(shù)據(jù)決策實驗室(DM2 Lab, University of Notre Dame)嘗試使用一種新的思路去彌補這一鴻溝。為了統(tǒng)一稱謂,我們稱發(fā)出行為的人為「主動方」,包括搭訕者、粉絲、司機等;接受行為的人為「被動方」,包括被搭訕者、被關(guān)注者、乘客等,其中「主動方」存在產(chǎn)生惡性行為的可能。傳統(tǒng)的惡行檢測算法(suspicious behavior detection)往往以「主動方是否為攻擊者」的標簽作為優(yōu)化的變量,從而使得平臺可以對預(yù)測為正例者進行人工調(diào)查、再做出決策,調(diào)查過程費時費力。DM2 提出,讓「被動方」根據(jù)對「主動方」的特征或者行為歷史的觀察形成防范意識、選擇防御等級,例如女性乘客可以根據(jù)司機年齡性別、駕齡、過往評分和評價等信息進行篩選。這里就存在一個妥協(xié)的問題:防御等級過高,則得到服務(wù)的范圍和及時性會降低;防御等級過低,則安全又難以得到保證。用戶個體是很難選擇合理等級的,而平臺卻擁有海量數(shù)據(jù)和智能算法,可以為用戶推薦合適的防御等級并估計選取后的結(jié)果,讓用戶自行選擇。這樣用戶擁有安全意識、平臺也可以「推卸」一部分責(zé)任,信息鴻溝得以彌補,惡意行為的防范變得可操作、可執(zhí)行。
事實上,由用戶個體來防范惡行的思路并不是第一次出現(xiàn),如淘寶就有插件可以用來屏蔽差評師(好評率低于一定百分比的買家)。
圖二:差評師攔截插件
然而,這看似安全的作法,卻也有不小的負面影響。當賣家「防御等級」過高時,很多誠實卻打過低分的買家無法購買商品,導(dǎo)致賣家損失訂單。如下圖中的例子:
圖三:好評率為 85% 的誠實買家無法購買此家店的商品
DM2 所提出的 Actionable Objective Optimization (AOO) 算法將被動方的防御等級作為優(yōu)化變量,將整體的安全系數(shù)和服務(wù)質(zhì)量作為優(yōu)化目標,在最常見的二部圖 (bipartite graph) 形式的行為數(shù)據(jù)上,取得了很好的效果。該算法已被 IEEE BigData 2018 (http://cci.drexel.edu/bigdata/bigdata2018/) 接收為長文。第一作者為圣母大學(xué)一年級博士生趙通,指導(dǎo)老師是助理教授蔣朦。
很多關(guān)于惡性防范算法的文獻都發(fā)現(xiàn),在用二部圖表示的行為數(shù)據(jù)上,異常密集的二部子圖(dense bipartite core)十分可疑。當我們用矩陣 A 來表示這個二部圖時,原圖中密集的子圖就變成了矩陣 A 之中密集的子矩陣?,F(xiàn)有的傳統(tǒng)方法大多是通過各種方式最終給每一個主動方打上一個可疑程度的分數(shù),這些分數(shù)放在一起就是一個長度為主動方總數(shù)的向量 p。然后,再去優(yōu)化那些較可疑的主動方所形成的子矩陣 的密度 J ,所以目標方程可以表達為:
與傳統(tǒng)地去優(yōu)化主動方可疑程度這一變量的方法不同,AOO 的思路在于優(yōu)化被動方的防御等級,使得最終被屏蔽掉的行為成為一個密度遠大于正常數(shù)據(jù)的子矩陣。AOO 要去給每個被動方一個針對主動方的某個特性的防御等級或是門檻,它們放在一起則是一個長度為被動方總數(shù)的向量 v。當主動方 i 的特性不能滿足被動方 j 的門檻時,j 便可以屏蔽掉與 i 的這次行為。那么優(yōu)化這個被屏蔽掉的行文所形成的子矩陣的目標方程就是:
這兩個公式看似相似,實則大不相同。因為他們完全從主動方和被動方兩個角度切入了這個研究問題。并且實際上只有被動方才是可以提前防范惡意行為的執(zhí)行者。
在網(wǎng)購平臺中,主動方(買家)的特征可以為這個買家的歷史平均評分。被動方(賣家)的防御等級自然如同上文中提到的淘寶插件,是一個可以在此店購買的商品的買家平均評分門檻。如此以來,當買家的歷史平均評分低于賣家的門檻時,這個買家就無法在這家店購物。
當我們給定一個數(shù)據(jù)集后,通過給每個賣家生成一個門檻而生成一個長度為賣家數(shù)量的相當 v 之后,我們便可以利用 v 和 A 來計算出一個 0/1 矩陣 B。對于 B 中的每一個值 ,若賣家 j 會屏蔽掉與買家 ‘i 的交易,
的值就是 1,如不會屏蔽則為 0。當然,只有本來就有交易的買家與賣家才會被考慮,所以我們用矩陣 I 來表示交易存在與否,即如果賣家 j 與買家 i 之間本來就沒有交易,
自然是 0,反之則為 1。
圖四:簡單的評分數(shù)據(jù)樣例演示矩陣 A 與 B
如果用數(shù)學(xué)公式來表達的話。我們首先可以方便地求得表示每個買家歷史平均打分的向量 u:(m 為買家的數(shù)量,n 為賣家的數(shù)量)
然后我們便可求得矩陣 B:
接下來,我們只需要找出矩陣 B 中,被屏蔽了一定次數(shù)()的買家以及屏蔽了一定數(shù)量(
)買家的賣家。我們通過兩個 0/1 向量
和
來指示相應(yīng)的買家和賣家是否為霸凌者與被霸凌者:
這些買家與賣家形成一個子矩陣,我們的目標是最大化這個子矩陣的密度。在求它的密度之前我們首先需要求出這個子矩陣的大?。ㄩL寬
)與他的內(nèi)容之和(e):
所以我們的目標方程可以表示為:
通過對帶有矩陣變量的函數(shù)求偏導(dǎo),可以求得該目標方程關(guān)于 v 的一階導(dǎo)數(shù)。由于我們的目標方程較為復(fù)雜,我們首先對其進行簡單的分解:
這樣我們只需要求出這個式子中的三個重要的偏導(dǎo)便可得出最終目標方程的導(dǎo)數(shù)。這三個偏導(dǎo)為:
(其中為 sigmoid 方程,為 sigmoid 方程的參數(shù),具體推導(dǎo)過程請參照原論文。)
有了目標方程關(guān)于 v 的導(dǎo)數(shù)后,我們只需通過梯度下降法便可優(yōu)化出一個優(yōu)秀的向量 v,而其中所包含的正是每個賣家所需要設(shè)置的門檻。通過利用整個平臺的大數(shù)據(jù)所優(yōu)化出的每個賣家的門檻,自然會比賣家自己憑借少量經(jīng)驗所設(shè)置的要有效得多,而且不會「誤傷」太多誠實買家從而更多地保留了銷售額。
在實驗中,這篇論文同時用了人造數(shù)據(jù)以及真實數(shù)據(jù)來佐證其效果。文中的人造數(shù)據(jù)設(shè)定十份復(fù)雜以求盡量涵蓋多種現(xiàn)實中可能出現(xiàn)的情況。在人造數(shù)據(jù)中,本文所提出的 AOO 與多個最為流行的異常行為檢測算法和欺詐行為檢測算法做了對比,并取得了相同或更優(yōu)秀的結(jié)果。
圖五:當有一組或多組霸凌買家時,方法在霸凌買家做出不同數(shù)量的差評時的效果。與流行的幾個異常行為檢測算法(KDD'14, KDD'16)作比較,AOO 的效果幾近完美。
在真實數(shù)據(jù)的實驗中,由于并沒有任何平臺公開過帶有是否為霸凌買家的標簽的數(shù)據(jù),這篇論文采用了美國亞馬遜(Amazon.com)的商品評論數(shù)據(jù),并對 AOO 所檢測出的疑似惡意產(chǎn)品評論與其他的買家所做出的產(chǎn)品評論做了對比。結(jié)果十分有趣:
圖六:美國亞馬遜商品評論詞云
在圖六中,圖六(a)所顯示的是整個數(shù)據(jù)集中所有商品評論的用詞頻率的詞云,從中可以看出整體數(shù)據(jù)集是傾向于好評的,用戶也有用了很多非常正面的詞匯比如:good, love, like, great 等。圖六(b)所顯示的是 AOO 所檢測出的可疑差評的詞云,圖六(c)所顯示的是 AOO 認為并不可疑的評論中的差評的詞云。從圖中可以看出,在同樣都是差評,同樣都出現(xiàn)了高頻率的 bad, boring 等負面詞匯的情況下:圖六(c)中的詞匯更為溫和,如 disappointing, problem, unfortunately;而圖六(b)中的詞匯卻很暴戾甚至帶有侮辱性,如 terrible, stupid, horrible, hell。雖然數(shù)據(jù)本身并無官方標簽來驗證 AOO 所得出的結(jié)果是否正確,但是數(shù)據(jù)中的評論詞匯說明了這些用戶帶有更多的惡意。
在本文中,我們簡單地介紹了 BigData2018 這篇防范惡意行為的論文。這篇論文新穎地提出了從用戶、被害者的角度去提前防范惡意行為的思路。文中的 AOO 模型雖然已經(jīng)在評分的數(shù)據(jù)中取得了不錯的效果,但是要想讓人們在多種復(fù)雜的生活環(huán)境中去防范各種各樣的惡意行為,還需學(xué)者們對這一領(lǐng)域進行更加深入的研究。相信不久之后會有越來越多的從用戶的角度關(guān)注問題的相關(guān)文章出現(xiàn),更多以人為本的研究課題被提出。讓我們拭目以待!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。