0
| 本文作者: 周蕾 | 2019-06-26 23:11 |
2010年就成立的邦盛科技,在金融風控反欺詐領域的資歷不可謂不深。但就是這樣一家老牌技術服務商,卻走了一條不太常規(guī)的路子:從成立之初到現(xiàn)在,邦盛有將近一半的時間在全力攻克流式大數(shù)據實時處理平臺“流立方”,再去開展融資和商用。
現(xiàn)在的流立方,號稱有著超高并發(fā)與超低延時的特性,同時支持多種復雜事件的計算。從業(yè)務版圖來看,流立方也正是邦盛整個金融實時風控反欺詐堡壘的頂梁柱。這次,雷鋒網AI金融評論就和邦盛科技創(chuàng)始人兼CEO王新宇博士聊了聊流立方的誕生始末。
邦盛的技術思路,逃不開對“時間”的要求。
在王新宇看來,剛剛在線上產生的數(shù)據,需要結合歷史數(shù)據,才能對它進行實時的價值判斷,而不是僅分析當前的數(shù)據本身:“例如把過去一年所有交易行為的流水全部分析一遍,對比當前才知道有沒有風險?!?br/>
流立方要成為的,就是這樣一個實時大數(shù)據處理引擎:兼顧數(shù)據的時間跨度和新鮮度,還有計算速度,解決數(shù)據倍增、數(shù)據處理時效差和數(shù)據處理毫秒級需求的問題。
這能為風控反欺詐帶來什么?王新宇博士以時間窗口問題為例,更詳細地解讀了流立方的目的和設計:
比如做攻防模型的時候,一開始想到采用過去三個月的交易平均額放進模型,然后與黑色產業(yè)鏈攻防。但它的欺詐手段如果發(fā)生變異,之前的模型可能就失效了,對方能繞過這個模型。
升級的時候,發(fā)現(xiàn)當時用的指標,過去三個月的平均交易額不及過去一個月的管用——但如果要以這個時間維度,重新現(xiàn)場計算相關指標和數(shù)據,與黑產的攻防交手過程中就已經損失很多時間和金錢了。
流立方做到時間窗口的動態(tài)拉伸,也就是(時間上)任意指定起點和終點,在毫秒級給出運算結果。
官方數(shù)據顯示,流立方集群部署少量節(jié)點即可達百萬筆每秒,平均延遲在1毫秒左右。王新宇告訴雷鋒網,在實際應用中,最復雜的客戶延遲大概在6~13毫秒之間;普通的客戶基本能達到1~6毫秒。
邦盛科技的一系列風控反欺詐產品,也全數(shù)基于流立方這個核心底層技術平臺,更強調“實時”這一效果的完成度。在實時風控的整體系統(tǒng)上,邦盛也自主研發(fā)了機器學習、關聯(lián)圖譜、設備指紋、人機識別等多項相關技術加以輔助。
盡管在金融風控領域,已有不少企業(yè)也表示能夠達到實時的效果,例如完成貸款的秒級審批和放貸,不過王新宇認為,授信模型的秒批秒貸,初步需要的數(shù)據量并不算大;與交易環(huán)節(jié)相比,用戶對授信的延時情況也沒有那么敏感。
但如果要收緊風控尺度,做到深層次的個人信用數(shù)據實時分析,還是需要大量實時計算,這正是流立方精通之處:“例如用戶過去24小時通話超過5次的對象,這些人又和誰通話超過5次?類似這樣的(關系)傳播開去,計算量也會非常大?!睋?,平安銀行的信用卡網申系統(tǒng)就有采用流立方這一技術平臺,并從2016年開始,將所有信用卡相關的交易均以實時模式接入流立方支撐的風控系統(tǒng)。
像銀行卡支付這樣的業(yè)務環(huán)節(jié),要求則更為嚴苛。王新宇介紹稱,其合作機構銀聯(lián),在做反欺詐的時候往回追溯數(shù)據,要面對一年1200億筆的交易流水,日均水平在4億筆左右,可能還需要在6~13毫秒內完成判別。
熬走三波股東,“流立方”艱難降生
在有這樣的業(yè)務規(guī)模之前,王新宇和邦盛團隊的其他成員一起,懷揣著一個宏大的目標,也經歷了一段不太明媚的日子——很難想象一家創(chuàng)業(yè)公司,成立五年之后才開始進入業(yè)務推廣期。
最初,創(chuàng)始團隊在浙大網新與華爾街的IT服務合作中注意到,國內的金融機構無論是在硬件還是軟件上,都依賴國外的基礎平臺。
“我們就想,能不能研發(fā)國人自有的核心基礎軟件?從理論層創(chuàng)新一直到底層核心的那種,而不是像以前那樣:國外軟件商提供中間件,國內只是做個業(yè)務系統(tǒng)?!蓖跣掠钚ρ裕@也正是邦盛科技名字的由來:
“國邦昌盛——我們想擺脫這種相當于中國企業(yè)都在給國外企業(yè)打工的局面?!?/p>
因為有過不少金融IT分析類的項目經驗,也接觸過多個相關賽道的國外SaaS服務商,在創(chuàng)業(yè)初期,邦盛的團隊很快將目光鎖定在金融數(shù)據分析的賽道上。
他們認為,尤其是國內互聯(lián)網還有如此龐大的訪問量,能把數(shù)據分析得又準又快的話,就一定會有市場。
于是在2010年,中國工程院的陳純院士帶領他的弟子們創(chuàng)立了邦盛科技,王新宇也是其中的一員。2007年從浙大計算機學院博士畢業(yè)的他,隨即和兄弟們投入到流立方的研發(fā)當中去。

邦盛科技創(chuàng)始人兼CEO王新宇博士
然而,要讓數(shù)據分析兼?zhèn)錅蚀_度和速度,這樣的研發(fā)目標就好比魚和熊掌兼得,難度也超出了他們的預期范圍。
流立方的內部,是一個又一個技術難點。除了前文所述的時間窗口問題,還有內存計算、增量計算、機器學習模型的實時決策等等……原計劃最多用三年時間做研發(fā),結果“從成立到現(xiàn)在,差不多有一半的時間都在攻克最底層的東西。”
這樣的做法不可謂不冒險?!肮蓶|們會覺得,應該接一些開發(fā)集成項目來養(yǎng)公司,而不是全部投入到研發(fā)上?!蓖跣掠罡嬖V雷鋒網,在流立方的“燒錢研發(fā)、不搞收入”期間,邦盛熬走了三波股東。
他回憶,當時股東們認為可以拿一些成型的開源框架稍加修改,先把可用的產品推出市場銷售。但在創(chuàng)始團隊看來,開源框架的天花板太低了,它的理論模型“技術擴展性不行”。
“如果用開源做了,那基本上只是開源的水平,想要再大幅往前超過它就不太可能了,會受到它各種限制,不如全部從頭自己做起?,F(xiàn)在從底層開始做的話,就有希望大幅超過開源的性能和能力?!蓖跣掠罱忉尩馈?/p>
因此,技術團隊堅持要先把“獨家的東西”做出來。直到2015年,有了流立方和20余項核心專利,邦盛科技才完成自己的A輪融資,正式開展自己的業(yè)務。
如今的流立方除了有超高并發(fā)和超低延時的特性以外,在擴展性方面也下了功夫:自帶可計算分布式緩存,在內存不足時,能夠平滑擴展到多節(jié)點;能夠提供基于Paxos算法的多副本一致性存儲機制,確保數(shù)據存儲的高可靠性。
除了前文所述的平安銀行,目前流立方的服務領域包括銀行、第三方支付、證券、保險、互聯(lián)網金融等,邦盛科技合作的大中型金融機構累計近400家——這樣的實戰(zhàn)案例,也使得他們擁有更多輸出標準化方案的底氣。
“標準化的路線,是在與頭部客戶的合作中,不斷學習(金融知識)積累而成的?!蓖跣掠罡嬖V雷鋒網,近年來邦盛陸續(xù)攢下近3000個風控模型,涵蓋160+個風控場景;目前邦盛大約僅有10~20%左右的業(yè)務以定制化形式交付。
今年6月,邦盛順利完成了3.5億元人民幣的C輪融資,正式邁入下一階段。
為什么執(zhí)著于底層技術?“對金融機構來說,太底層的東西,他們反而不會做。”當被問起第三方風控技術服務商的未來,王新宇這樣說道。
持牌金融機構加碼科技投入,逐漸長出自己的風控能力,很難說第三方風控企業(yè)的生存現(xiàn)狀不會因此而受到影響,但于邦盛而言,對底層技術的“固執(zhí)”曾經是一種冒險,如今更是他們在產品同質化嚴重的行業(yè)里殺出重圍的武器。
邦盛科技的下一步是什么?2018年的邦盛,重心或許更多放在金融領域的橫向開發(fā)上,包括保險智能反欺詐、證券量化實時策略計算、網絡自動化攻擊防御等。
而在2019年,邦盛計劃繼續(xù)以流立方為基礎,嘗試向金融以外的行業(yè)伸出觸角。據悉,未來邦盛將在軌道交通、物流、電力、氣象、軍工、反恐等方面進行相關的產品開發(fā)。王新宇表示,一切會產生大量熱數(shù)據、有望實現(xiàn)熱數(shù)據價值最大化的賽道都有可能涉足。
更值得期待的是,邦盛正在研發(fā)下一個核心技術:多重關系的秒級實時計算。王新宇向雷鋒網透露,這一底層基礎平臺的研發(fā)兩年前就已啟動,目前技術攻關部分已經接近尾聲,不久的將來就會進入商用階段。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。