0
本文作者: 叨叨 | 2017-08-05 19:27 |
雷鋒網(wǎng)按:8 月 5 日,在 Rebuild 2017 大會(huì)上,智融集團(tuán) CEO 焦可發(fā)表了題為《智能如何重新定義金融的邊界》,分享了傳統(tǒng)金融機(jī)構(gòu)業(yè)務(wù)與智能金融的差異,并講述了智能是如何解決傳統(tǒng)金融不平等的問(wèn)題。雷鋒網(wǎng)根據(jù)現(xiàn)場(chǎng)速記進(jìn)行了整理。
以下是智融集團(tuán)創(chuàng)始人焦可的演講實(shí)錄,雷鋒網(wǎng)在不改變?cè)獾幕A(chǔ)上做了精編:
《智能如何重新定義金融的邊界》,看到這個(gè)標(biāo)題的時(shí)候,我想最抓眼球的,一定是“智能”這兩個(gè)字。人工智能在最近的這段時(shí)間已經(jīng)成為大家不可忽視的一個(gè)話題,從餐館的服務(wù)員、到出租車司機(jī),每個(gè)人都能聊兩句人工智能相關(guān)的東西。借用李開(kāi)復(fù)老師的一句話來(lái)講,他覺(jué)得人工智能已經(jīng)從一個(gè)科學(xué)、科技變成一種科幻,我們希望它不要變成魔幻。
所以,真正吸引我們的是什么呢?首先,只有智能我覺(jué)得是不夠的。智能就像一把錘子,我們不能舉著一個(gè)錘子滿世界去找釘子。那么釘子是什么?釘子就是金融的邊界。
我先介紹一下,在我們眼里傳統(tǒng)金融的邊界在哪里?
我們真正找到金融的邊界花了很多成本,這張圖,其實(shí)就是一個(gè)實(shí)際的現(xiàn)狀。在中國(guó),只有15%左右的人,能夠被傳統(tǒng)金融機(jī)構(gòu)所服務(wù)。但是在歐美,實(shí)際上有70%的人可以被傳統(tǒng)金融機(jī)構(gòu)所服務(wù)。
這也回答了剛才金證濟(jì)蒼(Video++創(chuàng)始人&CEO)提到的問(wèn)題,為什么在以色列 IMVC 機(jī)器視覺(jué)大會(huì)上,如果有1000萬(wàn)美元會(huì)投哪個(gè)AI應(yīng)用領(lǐng)域,1600位 AI 的科學(xué)家沒(méi)有把票投給金融和安防,因?yàn)閷?duì)于歐美這些發(fā)達(dá)的國(guó)家來(lái)講,這可能已經(jīng)不是一個(gè)太大的問(wèn)題。
所以,我們跟很多美國(guó)的信貸公司交流的時(shí)候,他們其實(shí)非常羨慕我們,因?yàn)橛X(jué)得中國(guó)有一個(gè)巨大的市場(chǎng)機(jī)會(huì)。中國(guó)的傳統(tǒng)供給是不夠的,所以這才給新技術(shù)有了發(fā)揮的空間。
就像在過(guò)去幾年看到的手機(jī)支付,在中國(guó)其實(shí)遠(yuǎn)遠(yuǎn)超過(guò)了美國(guó)。就是因?yàn)樵诿绹?guó),卡支付已經(jīng)是一個(gè)非常普遍的手段,留給這些新技術(shù)的空間非常小。但是在中國(guó),我們看到的是一個(gè)巨大的沒(méi)有被滿足需求的市場(chǎng)。
我們剛剛看到了金融的邊界,接著深入想一個(gè)問(wèn)題——金融的邊界為什么在這里,為什么傳統(tǒng)金融沒(méi)有為剩下的巨大市場(chǎng)服務(wù)?
這在我們看來(lái)其實(shí)是一個(gè)傳統(tǒng)金融機(jī)構(gòu)的審美問(wèn)題。我不知道大家有沒(méi)有去銀行辦過(guò)信用卡,或者辦過(guò)貸款,銀行基本上都會(huì)要求大家提供一些材料,比如說(shuō)提供你的征信報(bào)告、社保、工資證明、工作證明,提供各種各樣的抵押品、資產(chǎn)證明等。但是,當(dāng)你不符合它的審美的時(shí)候,往往你就會(huì)被拒掉。
我們知道,中國(guó)是一個(gè)數(shù)據(jù)建設(shè)并沒(méi)有那么完善的國(guó)家,我們看到有很多年輕人實(shí)際上是沒(méi)有征信記錄的,有很多私人企業(yè)里,發(fā)工資的方式是用現(xiàn)金,很多人是沒(méi)有社保的,很多人也沒(méi)有車、房這樣的資產(chǎn)。這些人,就不符合傳統(tǒng)金融機(jī)構(gòu)的審美。
在我們看來(lái),傳統(tǒng)金融機(jī)構(gòu)就像是數(shù)據(jù)冰山水面上的部分,好處是看得很清楚。但是,壞處是它只能代表個(gè)人數(shù)據(jù)非常小的一部分。
我們的一個(gè)觀點(diǎn)是,如果能利用好水面之下的數(shù)據(jù),能夠去看到這個(gè)人更多的信息,那么我們就能發(fā)明一種新的審美,而這種審美是不同于傳統(tǒng)金融機(jī)構(gòu)審美的。
傳統(tǒng)金融機(jī)構(gòu),我們經(jīng)常做一個(gè)比喻,像什么呢?像是一個(gè)篩子,它用了幾條規(guī)則,去把這一堆蘋果里面的大蘋果篩出來(lái)。而漏掉的蘋果里,一定有一些好的蘋果,但是他們是沒(méi)有辦法判斷這個(gè)蘋果是好是壞,我們?cè)谧龅氖虑?,是發(fā)明一桿秤,去真正的測(cè)量這個(gè)蘋果是好是壞。
所以,我們現(xiàn)在可以做到,單月信貸業(yè)務(wù)量已經(jīng)突破150萬(wàn)筆。這個(gè)數(shù)字其實(shí)對(duì)于傳統(tǒng)金融機(jī)構(gòu)來(lái)講是個(gè)天文數(shù)字,因?yàn)橐粋€(gè)銀行網(wǎng)點(diǎn)一般一個(gè)月的信貸業(yè)務(wù)量可能也只有幾百筆、幾千筆,150萬(wàn)筆對(duì)傳統(tǒng)金融機(jī)構(gòu)來(lái)講是一個(gè)不可能的數(shù)據(jù)。
但是,這150萬(wàn)筆背后還有一些更神奇的數(shù)字,我們現(xiàn)在做一筆信貸業(yè)務(wù)只需要通過(guò)8秒的時(shí)間。全程是沒(méi)有任何人工介入的,每天7×24小時(shí)的工作。
我們公司里沒(méi)有傳統(tǒng)金融機(jī)構(gòu)的人,沒(méi)有一些“老司機(jī)”告訴我們什么是好用戶、什么是壞用戶。
先舉一個(gè)很好理解的例子。這是 Google 在做的一個(gè)項(xiàng)目,如何在一堆動(dòng)物圖片里面找到貓和非貓,如果我們按照傳統(tǒng)的方法,可以寫一個(gè)規(guī)則引擎,可以寫幾條規(guī)則。
比如說(shuō),如果這張圖片的物體里面有毛的紋理,如果這個(gè)輪廓上面有尖的耳朵,如果有尾巴,如果這個(gè)東西有胡子,你可以判斷這是一只貓。但是實(shí)際上你會(huì)發(fā)現(xiàn),這樣首先會(huì)引入很多錯(cuò)誤,有時(shí)候你會(huì)把狐貍找出來(lái)了,如果這只貓是只折耳貓或者是無(wú)毛貓,或者是它在圖片里面把貓的尾巴隱藏起來(lái)了,這只貓你就會(huì)錯(cuò)過(guò)。
但是 Google 是怎么做的?Google 實(shí)際上并沒(méi)有找動(dòng)物專家去判斷、定規(guī)則什么是貓,Google 的做法是把一大堆圖片里哪些是貓、哪些不是貓標(biāo)注出來(lái),扔給模型,讓模型自己去找到它的特征,讓模型自己去發(fā)現(xiàn)規(guī)律,這個(gè)時(shí)候你發(fā)現(xiàn)它的準(zhǔn)確度和召回率都要遠(yuǎn)遠(yuǎn)高于人的能力。
我們?cè)谧龅氖虑楦@個(gè)有很類似之處,我們?cè)谧龅氖虑橐彩窃谝欢堰@樣的用戶里面去找到哪些是貓,哪些是非貓,哪些人是我們傳統(tǒng)意義上會(huì)還錢的用戶,哪些人誠(chéng)信是有問(wèn)題的。
而這些事情不是像傳統(tǒng)金融機(jī)構(gòu)一樣寫一個(gè)規(guī)則引擎,我們不是這么做的。規(guī)則引擎是什么?就像我們談到的,傳統(tǒng)的金融是怎么判斷你的風(fēng)險(xiǎn)的呢?是做一堆規(guī)則,如果你的工資大于多少,并且你有社保,以及你的征信報(bào)告是怎么樣的,然后你是可以通過(guò)的,或者你就被拒掉了。這是傳統(tǒng)金融的規(guī)則引擎。
但是在我們看來(lái),這種規(guī)則引擎跟剛才那個(gè)貓的例子是一樣的,總是受到人的局限。特別是在人無(wú)法進(jìn)行判斷的業(yè)務(wù)領(lǐng)域里面,局限就越發(fā)明顯。
而我們?cè)谧龅氖虑榫褪俏覀儼岩淮蠖讶说奶卣魅拥侥P屠镞叄屇P透嬖V我們什么是好的用戶,什么是壞的用戶。
我們最核心的一個(gè)技術(shù)就是 I.C.E.
I.C.E. 實(shí)際上是三個(gè)英文單詞首字母的縮寫,就是 Identification、Calculation、Evaluation,這三個(gè)環(huán)節(jié)其實(shí)也是很多人工智能領(lǐng)域里,都會(huì)碰到的。
第一,辨識(shí),找到這個(gè)事件、業(yè)務(wù)里的特征。比如對(duì)于智能駕駛,就要找到識(shí)別路上的物體都是什么東西;第二,計(jì)算要處理大量的人工無(wú)法處理的特征,這個(gè)時(shí)候要有充分的計(jì)算能力;第三,決策、評(píng)估,究竟該左轉(zhuǎn)、右轉(zhuǎn)、踩剎車還是油門。
這是人工智能的三個(gè)環(huán)節(jié),在金融領(lǐng)域里面,同樣有這樣的三個(gè)環(huán)節(jié):
第一,柯南特征工程
從大量的數(shù)據(jù)里面找到那些真正跟客戶逾期率相關(guān)的特征。
對(duì)于傳統(tǒng)金融來(lái)講,他們看到的特征可能是那幾項(xiàng)、十幾項(xiàng)特征,但是對(duì)于我們來(lái)講,我們看到的是一個(gè)用戶1200個(gè)以上特征,而這個(gè)特征是跟逾期率相關(guān)的,我們看過(guò)的特征也遠(yuǎn)比這個(gè)數(shù)據(jù)要多很多,我們看過(guò)各種各樣奇奇怪怪的特征。比如說(shuō)我們之前也試過(guò)說(shuō)星座會(huì)不會(huì)跟逾期相關(guān),處女座會(huì)不會(huì)愛(ài)還錢?其實(shí)沒(méi)有。
但是你發(fā)現(xiàn)有很多更奇怪的特征是跟客戶相關(guān)的。比如說(shuō)我們會(huì)看到用戶在使用的時(shí)候,輸入身份證號(hào)的節(jié)奏會(huì)不一樣,而這種節(jié)奏跟客戶的逾期率相關(guān)。我舉的這個(gè)例子相對(duì)大家不太好理解,但是你發(fā)現(xiàn)有更多的特征,實(shí)際上是非結(jié)構(gòu)的數(shù)據(jù),是一種人類無(wú)法解釋的數(shù)據(jù)。就像 AlphaGo 一樣,如果用規(guī)則引擎來(lái)寫這樣的規(guī)則,你知道他為什么會(huì)下這步棋,但是 AlphaGo 為什么會(huì)下這步棋,你實(shí)際上是不知道的。
我們?cè)谔卣黝I(lǐng)域可以發(fā)覺(jué)到遠(yuǎn)遠(yuǎn)比人的經(jīng)驗(yàn)更深入的一些特征,而且絕大多數(shù)的特征都是人的計(jì)算力無(wú)法去計(jì)算的。有了這些特征之后,為什么我們能夠知道這些特征是跟逾期率相關(guān)的?是有賴于我們接下來(lái)的模塊。
第二,D-AI機(jī)器學(xué)習(xí)模型
我剛才談到不依賴傳統(tǒng)的金融專家告訴我們什么是好的、什么是壞的,為什么?
回到我們最開(kāi)始的數(shù)字,我們單月的業(yè)務(wù)量已經(jīng)突破了150萬(wàn)筆,而這150萬(wàn)筆意味著什么?意味著每天就有5-6萬(wàn)的用戶在使用我們的信貸服務(wù)。這5-6萬(wàn)個(gè)用戶下個(gè)月實(shí)際的表現(xiàn)就會(huì)告訴我們,他是一個(gè)好用戶還是壞用戶,相對(duì)而言,跟人的經(jīng)驗(yàn)比起來(lái),我們更相信的是實(shí)際的數(shù)據(jù)。
這個(gè)很類似于剛才那個(gè)貓,甚至比那個(gè)貓的意思更好一點(diǎn),根本就不需要雇人標(biāo)什么是貓、什么不是貓,用戶實(shí)際上會(huì)用行為告訴我們。
當(dāng)這5-6萬(wàn)用戶每天回來(lái)的時(shí)候,大概計(jì)算一下,5-6萬(wàn)的用戶加上每個(gè)用戶有1200個(gè)特征點(diǎn),所以你每天處理的特征點(diǎn)數(shù)是幾千萬(wàn)的數(shù)量,而這個(gè)時(shí)候可以充分地告訴我們什么是好用戶,什么是壞用戶。
就像一個(gè)傳統(tǒng)的風(fēng)控人員,他的風(fēng)控也是來(lái)自于對(duì)一些案例的學(xué)習(xí),可能今年放了幾百筆,明年看看這幾百筆的效果。但是他的量級(jí)和速度是遠(yuǎn)遠(yuǎn)跟不上機(jī)器。
所以,我們現(xiàn)在每個(gè)月機(jī)器學(xué)習(xí)的次數(shù)其實(shí)是上百次,這個(gè)跟傳統(tǒng)金融是不一樣的,傳統(tǒng)金融可能半年、一年會(huì)迭代一次模型,但是我們每個(gè)月、每天模型都在發(fā)生大量的變化。
而我們線上在跑的模型也不是一個(gè),實(shí)際上每天線上放出幾萬(wàn)筆貸款的時(shí)候,背后的模型是有幾百個(gè)模型。這是跟傳統(tǒng)金融很不一樣的地方。
第三,Anubis 大數(shù)據(jù)計(jì)算架構(gòu)
為了支撐這么大的計(jì)算量,我們搭了一個(gè)大數(shù)據(jù)計(jì)算的架構(gòu),每天處理的數(shù)據(jù)量已經(jīng)超過(guò)了5T。特征進(jìn)行全量樣本的迭代速度,其實(shí)只需要15分鐘,真正進(jìn)行線上的審核是8秒鐘。所以這一切對(duì)傳統(tǒng)金融來(lái)講都是新的變革。
從實(shí)際的案例里面看到,用人工智能技術(shù)去解決金融的需求,確實(shí)是一個(gè)很有意思的話題,我們發(fā)現(xiàn)金融天然就是跟數(shù)字打交道的,所以在這里會(huì)有很多數(shù)據(jù)產(chǎn)生,而金融天然又是正負(fù)樣本非常清楚的業(yè)務(wù),還或者是不還,股票的漲跌,保險(xiǎn)賠還是不能賠,這都是被實(shí)際迭代出來(lái)的樣本、學(xué)習(xí)的對(duì)象。
我們發(fā)現(xiàn)機(jī)器會(huì)比人更加擅長(zhǎng)處理大量數(shù)據(jù)的定量計(jì)算,人比較適合做的是定性的,可以就可以,不行就拒掉,機(jī)器比人的學(xué)習(xí)速度要快很多,而且機(jī)器沒(méi)有偏見(jiàn),機(jī)器不會(huì)疲勞,機(jī)器沒(méi)有道德風(fēng)險(xiǎn),我們不用擔(dān)心說(shuō)像傳統(tǒng)金融領(lǐng)域一樣有很多從業(yè)者去做欺詐,我們機(jī)器是沒(méi)有可欺詐的部分。
當(dāng)你使用大量的特征點(diǎn)的時(shí)候,也會(huì)發(fā)現(xiàn)欺詐的用戶根本就無(wú)從下手,他不知道你是怎么建立這個(gè)模型的,如果你是一個(gè)規(guī)則引擎的話,就容易被人攻破。
但我們發(fā)現(xiàn)傳統(tǒng)金融產(chǎn)生資產(chǎn)的方式,傳統(tǒng)金融進(jìn)行風(fēng)控方式還是停留在原來(lái)的規(guī)則引擎,還是在用傳統(tǒng)的專家經(jīng)驗(yàn)去找到什么是貓,什么不是貓。
我們認(rèn)為互聯(lián)網(wǎng)金融正在進(jìn)入下半場(chǎng)的革命,下半場(chǎng)真正最核心的就是內(nèi)在技術(shù)(引擎革命)。
傳統(tǒng)金融實(shí)際上是一種燃燒不充分的金融,傳統(tǒng)的金融引擎燒的是什么呢?燒的是專家的經(jīng)驗(yàn)、人力。我們認(rèn)為新的金融模式應(yīng)該不是這樣的,新能源下的金融模式引擎燒的是數(shù)據(jù)、算法、工程師,這是新的引擎,真正的價(jià)值來(lái)自于新的引擎。
傳統(tǒng)金融之所以使用這樣的引擎,受到了傳統(tǒng)的局限,你發(fā)現(xiàn)傳統(tǒng)金融在開(kāi)展業(yè)務(wù)的時(shí)候,它往往是基于一個(gè)產(chǎn)品為中心的模式,它是先定義一些產(chǎn)品。比如說(shuō)白領(lǐng)貸、工薪貸、車抵貸、企業(yè)貸,往往先定義一個(gè)產(chǎn)品,然后定義規(guī)則,然后根據(jù)規(guī)則找到人。這就很像我們先生產(chǎn)出一批35號(hào)和40號(hào)的鞋,去找到適合這個(gè)鞋的腳,這個(gè)模式其實(shí)是有問(wèn)題的,因?yàn)橛袝r(shí)候你的腳比較小的時(shí)候,穿這個(gè)鞋很不舒服,如果你的腳比較大的時(shí)候,就要削足適履,這是傳統(tǒng)的金融。
那么我們期望在新金融模式下,能夠做到先找到人,通過(guò)技術(shù)評(píng)估一個(gè)人,通過(guò) I.C.E 判斷一個(gè)人的風(fēng)險(xiǎn),然后為他提供適合他的金融產(chǎn)品以及金融能力。
傳統(tǒng)的金融是一個(gè)少數(shù)人的金融,如果想改變這樣的問(wèn)題,改變這樣的不平等,需要的是一個(gè)更加有智慧的金融。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。