丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給木子
發(fā)送

0

沒人報案,那就讓數(shù)據(jù)自己報案吧

本文作者: 木子 2020-05-14 13:56
導語:魔高一尺道高一丈,支付寶能讓數(shù)據(jù)找“匕首”。

從SIGIR2020到IJCAI2020,隨著國際一系列頂級學術(shù)會議(頂會)的陸續(xù)開啟,全球科學家們已經(jīng)迎來了2020年屬于自己的一道道“盛筵”。這些不同科技領(lǐng)域內(nèi)的頂級會議是前沿,更是未來。

逛頂會,聊技術(shù),本周實驗室小編就來說說頂會中的那些科學家的故事。

營銷活動是電商平臺最常見的業(yè)務(wù)模式,而針對平臺營銷活動主要的攻擊方式,就是通過虛假交易套利。簡單地說,就是賣家和買家合謀,通過作弊,騙取平臺的“紅包”。

這和風控領(lǐng)域中的其他風險有很大的不同。類似盜用賬號、欺詐等風險,都因為第三方受害者的投訴或報案,可以產(chǎn)生明確的風險標簽。它意味著,平臺很快可以知道,一項交易違規(guī)與否,并做出反應(yīng)。而合謀欺詐不會有人報案,也就不可能產(chǎn)生標簽。

平臺當然絕不允許這種合謀欺詐的存在,但這絕非易事。在相當程度上,科學家們需要讓案件在海量交易中“無中生有”——既然沒人報案,那就讓數(shù)據(jù)自己“報案”好了。

過去,人們是要從一群穿藍色外衣的人中,找到一個穿黃色衣服的人——那意味著一個有標簽的風險;而現(xiàn)在,人們是要從一群都穿藍色服裝的人群中,找到一個外衣下藏有匕首的人。

從機器人足球,到概率圖模型

要在每天上億筆交易里準確找出這種風險,并大幅提升風險攻防效率以滿足實際業(yè)務(wù)需要,是一件非常有挑戰(zhàn)性的事情。

這里的關(guān)鍵之處在于,支付寶特有的數(shù)據(jù)量為研究提供了基礎(chǔ);而龐大的業(yè)務(wù)量,又讓這種研究有了“性價比”。

解決這個問題的工作交到了支付寶天筭安全實驗室手里。

支付寶天筭安全實驗室隸屬于支付寶安全實驗室。該實驗室主要圍繞智能風控和反欺詐技術(shù),探索安全領(lǐng)域的機器學習等前沿問題,重點關(guān)注打造全球領(lǐng)先的智能風控體系,是守護支付寶“你敢付我敢賠”承諾的中堅力量。

因為沒有標簽,“我們不能用常規(guī)的分類,去解決這樣的問題”。劉騰飛希望把它變成一個機器學習的問題,并找到一種方法,來實現(xiàn)低成本、高效率的檢測。

 沒人報案,那就讓數(shù)據(jù)自己報案吧

劉騰飛是螞蟻金服數(shù)據(jù)技術(shù)專家,香港科技大學計算機科學與工程學系博士,主要研究無監(jiān)督異常檢測技術(shù)、弱監(jiān)督學習技術(shù)在風控領(lǐng)域的應(yīng)用。

高考后,因為第一年不分專業(yè)的原因,劉騰飛選擇了中國科技大學。按他的思路,這樣就避免了在對自己的興趣點仍然懵懂的情況下,“過早”規(guī)劃未來的職業(yè)方向。

在那一年里,劉騰飛發(fā)現(xiàn)了物理、化學的“恐怖”之處,而自己對芯片設(shè)計和通訊那些學科又提不起興趣,直到聽到一位老師對算法概念的描述,他才動了選擇計算機系的念頭。那位老師告訴他,算法就是解決問題的方法。

在AI科研領(lǐng)域,機器人世界杯(Robot World Cup)是一項重要的賽事,它有一個宏大的目標,是在人類足球規(guī)則下,用機器人在2050年戰(zhàn)勝人類的足球世界杯冠軍。

選中計算機專業(yè)后,劉騰飛一頭扎了進去。

仿真比賽是機器人足球比賽中“最古老”的比賽項目,它專注于人工智能和團隊策略的應(yīng)用。這個賽事分2個組別:2D和3D。

劉騰飛所在的中國科大藍鷹隊在2007年拿下了2D仿真組的全國冠軍,之后在2008年時,點球負于德國隊,拿到了世界亞軍。

因為長期沉湎于“足球”,劉騰飛連留學申請都沒有準備,這在中國科大的學生里,并不多見。于是老師把他推薦去了香港科技大學念博士。在那段時間里,他學習的領(lǐng)域是概率圖模型。

概率圖模型是一類用圖形模式表達基于概率相關(guān)關(guān)系的模型的總稱。近10年,它已成為不確定性推理的研究熱點,在人工智能、機器學習和計算機視覺等領(lǐng)域有廣闊的應(yīng)用前景。

但這和劉騰飛在支付寶天筭安全實驗室遇到的風險課題并不直接相關(guān),他和他的同事們要解決的問題都是新的,因此方法也必須是新的——唯一沒變的,就是對技術(shù)的創(chuàng)新——劉騰飛興趣滿滿。

讓數(shù)據(jù)自己找到“匕首”

好消息是,那些同樣身穿藍衣,但是懷揣匕首的人,仍可能表現(xiàn)得異乎常人。例如衣服局部的外形變化,走路的姿態(tài)變化……從數(shù)據(jù)中找出這些風險交易,最直接的做法是通過異常檢測,利用這些異乎尋常的蛛絲馬跡,來找到比較確定的標簽。

不過這種標簽在海量交易數(shù)據(jù)里仍只能覆蓋有限的部分,這就引出了另外一個問題——標簽不完全。

在實際業(yè)務(wù)中,這類標簽問題對應(yīng)的風控場景是廣泛的,遠不止于一個“買賣雙方合謀”的問題。正是因為這個原因,不止劉騰飛想找到解決方法,支付寶安全實驗室和學界都對此興趣盎然,這也是此后安全科研基金樂于介入的原因。

弱監(jiān)督學習是一個對應(yīng)的解決手段。它和有監(jiān)督學習、無監(jiān)督學習都是機器學習方法的主要分類,依據(jù)是看算法有無利用以及如何利用訓練數(shù)據(jù)中的標簽信息。弱監(jiān)督學習類算法可以解決標簽不準確、標簽不完全和標簽不確切的問題。

正樣本和無標簽樣本學習(PU learning)正是屬于弱監(jiān)督學習中的一類算法。它從只有正樣本和無標簽樣本的訓練數(shù)據(jù)中學習得到一個二分類模型,這里的無標簽樣本可能是正樣本,也可能是負樣本——這個正、負樣本,在支付寶等平臺的真實業(yè)務(wù)場景里,就對應(yīng)了風險的存在與否。

也是因為這個原因,正類和無標記類別學習(PU learning)適用于眾多的風控場景——劉騰飛能找到了那只帶來風險的“匕首”,依靠的就是它。

不過,它和真實的場景仍有差距。

“自古以來”,傳統(tǒng)的正類和無標記類別學習(PU learning)在解決問題時,數(shù)據(jù)都已經(jīng)放在了科學家的手里,是囊中之物。

但在線交易不是這樣,所有的數(shù)據(jù)像流水一樣持續(xù)涌入。到諸如雙十一時,這種涌入更將有如一道數(shù)據(jù)洪峰。

道高一丈

劉騰飛聯(lián)合署名的那篇論文——由支付寶天筭安全實驗室聯(lián)合南京理工大學完成的《Online Positive and Unlabeled Learning》,能夠成功被 IJCAI-2020接收,很重要的一個原因,就是它有效地處理了這種流式數(shù)據(jù),實現(xiàn)了在線更新模型,提升模型迭代速度的目的。

這篇論文的合作背景源于螞蟻金服的安全科研基金,它是一個螞蟻金服為促進產(chǎn)業(yè)界和學界交流的平臺項目。

國際人工智能聯(lián)合會議(IJCAI)是人工智能領(lǐng)域最頂尖的綜合性學術(shù)會議之一,被中國計算機學會(CCF)推薦國際學術(shù)會議列表認定為 A 類會議。會議議題涵蓋了自然語言處理、機器學習、人工智能理論、計算機視覺、語音技術(shù)、機器人科學等領(lǐng)域。

在這篇論文中,包括劉騰飛在內(nèi)的專家們提出了一種基于正類和無標記類別學習(PU Learning)以及在線學習(Online Learning)的新算法。

對于流式數(shù)據(jù)中的每個正例或者無標記樣本,新算法分別設(shè)計無偏損失項,以構(gòu)建基于流式數(shù)據(jù)的經(jīng)驗風險最小化模型,通過計算其無偏梯度,算法給出了基于在線梯度下降的分類模型更新迭代的方法。新算法在標準數(shù)據(jù)集和真實數(shù)據(jù)集上均取得了較好的效果。

這個“較好”的效果意味著,“更快的模型更新速度,將可以大幅縮短風險的暴露期?!眲Ⅱv飛說,支付寶希望風控能夠更快、更智能,而新算法在細分業(yè)務(wù)領(lǐng)域?qū)崿F(xiàn)了這一點?!澳Ц咭怀?,道高一丈”。

在過去一年中,支付寶的商家風控系統(tǒng)ARiskGo為“大潤發(fā)優(yōu)鮮”“餓了么”等累計1萬APP節(jié)省300億營銷費用,并獲得中國支付清算協(xié)會年度“安全應(yīng)用”大獎。它的能力中,就有支付寶天筭安全實驗室里劉騰飛和他同事們的那些研究成果。

這個系統(tǒng)賦能了產(chǎn)業(yè)界,解決了職業(yè)羊毛黨薅光羊毛、消費者薅不到真羊毛的問題。

劉騰飛說,他當年衷愛的機器人足球世界杯,有一個目標,那就是2050年時,機器人足球隊要戰(zhàn)勝人類世界杯冠軍,這個目標就像登月,宏大、長遠,前路漫漫,卻總讓人心懷喜悅為之努力,一如他與支付寶天筭安全實驗室的同事,在安全科技的路上涉海登山、步上月亮。


雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說