0
本文作者: 王金許 | 2017-11-06 17:34 |
雷鋒網(wǎng)按:11 月 6 日,京東舉行 JDD 京東金融全球數(shù)據(jù)探索者大會(huì),在全球范圍內(nèi)尋求志同道合的伙伴共同探索大數(shù)據(jù)和人工智能在金融領(lǐng)域的最佳實(shí)踐 。其中,國際人工智能聯(lián)合會(huì)理事會(huì)主席、香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系主任楊強(qiáng)作了演講,從學(xué)界角度探討了人工智能技術(shù)的商業(yè)化,以及人工智能在金融領(lǐng)域的應(yīng)用場景。
楊強(qiáng)認(rèn)為,算法應(yīng)用到實(shí)際場景中需要滿足三個(gè)方面的要求。第一,算法的閉環(huán)路徑要短。第二,反饋一定要是足夠高頻、高通量的反饋。第三,反饋效果一定要起到一個(gè)復(fù)合作用。
其次,他表示,技術(shù)風(fēng)口主要有基于圖像的學(xué)習(xí)和理解、自然語言理解、智能推薦、遷移學(xué)習(xí)四個(gè)方面。
而在技術(shù)革新和商業(yè)應(yīng)用的結(jié)合點(diǎn),他特別指出金融行業(yè)是擁抱智能時(shí)代的領(lǐng)跑者。在金融里面有各種各樣的應(yīng)用場景,比如和用戶溝通的場景、金融安全、活體識(shí)別、人臉識(shí)別、聲音識(shí)別、行為識(shí)別等等。另外運(yùn)營、投顧方面都可以借助于人工智能大量加強(qiáng)提高效益。
今年的 JDD 賽事中也緊貼金融行業(yè)的應(yīng)用場景,主要包括登陸的行為識(shí)別,信貸需求預(yù)測以及店鋪銷量預(yù)測,豬臉識(shí)別。
以下為楊強(qiáng)演講內(nèi)容實(shí)錄,雷鋒網(wǎng)在不改變原意的基礎(chǔ)上進(jìn)行了編輯。
剛才我們聽到了幾位從不同方面給我們解讀了人工智能、金融、大數(shù)據(jù)方面的前景,我要講的是從另一個(gè)方面來看這個(gè)問題。
我是一個(gè)做學(xué)術(shù)的,同時(shí)我對商業(yè)也有著濃厚的興趣,所以我想從從學(xué)術(shù)的角度來探討一下商業(yè)的問題,我們會(huì)得到哪些新的發(fā)現(xiàn)?
人工智能成功的商業(yè)模式
首先來看一下 AlphaGo 的成功能夠引起了很大振動(dòng),我們從中能學(xué)到什么,對商業(yè)方向有哪些指導(dǎo)。
AlphaGo 本身是幾種算法的結(jié)合,包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),算法和環(huán)境有一個(gè)有機(jī)連接,那么環(huán)境不斷給算法提供反饋。深度學(xué)習(xí)既能告訴你當(dāng)前狀態(tài),又能為未來行為提供一個(gè)指導(dǎo)。
這樣一個(gè)算法是不是可以應(yīng)用到實(shí)際當(dāng)中去呢?
第一,閉環(huán)路徑要短。商業(yè)路徑也好、算法路徑也好,它的中間最好不要有過多環(huán)節(jié),比方說從用戶到得到反饋,到反饋到AI的算法得到補(bǔ)充,最后再返回到應(yīng)用,這個(gè)閉環(huán)要足夠短。
第二,反饋一定要是足夠高頻、高通量的反饋,不斷得到反饋,系統(tǒng)得到刺激,這樣智能才能夠成長。
第三,也是大家過去比較忽略的,反饋效果一定要起到一個(gè)復(fù)合作用。我們在經(jīng)濟(jì)上經(jīng)常講復(fù)合收益,在人工智能上這一點(diǎn)也是非常重要的。也就是說,這一輪的反饋對系統(tǒng)增益要持續(xù)進(jìn)行,就會(huì)有一個(gè)指數(shù)型收益上升。
我們再看看周邊實(shí)際遇到的問題,是不是有很多類似場景滿足這樣的需求呢?
我們回顧一下人工智能的里程碑。1997 年,我們有深藍(lán),然后 2011 年的時(shí)候我們有 IBM Watson,最近我們又有了 AlphaGo,無人車,包括最近有了德州撲克,這些都是我們引以為豪的人工智能。
在這些里程碑的成功背后是不是路徑閉環(huán)足夠短,反饋?zhàn)銐蝾l繁?另外,復(fù)合作用是非常明顯的,系統(tǒng)在不斷改進(jìn)自己,智能在提升。
再看一下周邊工作,我就有一個(gè)想法:人工智能在現(xiàn)階段的應(yīng)用并不是在所有領(lǐng)域都會(huì)取得成功,我們一定要非常仔細(xì)挑選在哪些領(lǐng)域人工智能比較容易得到成功,在哪些領(lǐng)域還要等一等。
所以,下面就來看一下技術(shù)和商業(yè)這兩方面到底哪些是我們現(xiàn)在可以得到效益的風(fēng)口。
首先是技術(shù)風(fēng)口。人類的知識(shí)獲得 70% 以上都是通過視覺的,深度學(xué)習(xí)的發(fā)展肯定對人工智能應(yīng)用、對人工智能技術(shù)而言一定是持續(xù)發(fā)展的。比如,用更好的深度學(xué)習(xí)、可解釋的深度學(xué)習(xí),包括理解物體之間的關(guān)系,以及通過一個(gè)視頻可以理解里面的一些人類能理解的摘要,把它給取出來,為人類和計(jì)算機(jī)的模型進(jìn)行溝通。
自然語言緊隨其后。包括文本閱讀、理解、產(chǎn)生、問答、分析等等,現(xiàn)在深度學(xué)習(xí)都帶來了非常大的提高。但是,這個(gè)提高還是要隨著算法的提升有待進(jìn)一步提高,從而在在使用當(dāng)中能夠產(chǎn)生更大的效益。
另一個(gè)是智能推薦。在電商的網(wǎng)上購物等等都有,但推薦的一個(gè)重大問題是我們很容易陷入一個(gè)所謂的深坑,也就是在機(jī)器學(xué)習(xí)技術(shù)上所說的過擬合:當(dāng)我們點(diǎn)擊了一個(gè)在手機(jī)上的新聞,我們會(huì)得到好多類似的新聞,而不會(huì)顧及我們對其他(新聞)的興趣。
怎么樣解決這些問題呢?這就是技術(shù)革新所期待的,我們也在不斷做新的研究。
還有一個(gè)就是我個(gè)人研究的遷移學(xué)習(xí)。人類很自然就會(huì)使用遷移學(xué)習(xí),比方說我們在一個(gè)領(lǐng)域很專業(yè),怎么把這個(gè)知識(shí)遷移到另一個(gè)領(lǐng)域,能不能讓計(jì)算機(jī)也有這個(gè)能力?有很多專家認(rèn)為這就是人工智能機(jī)器學(xué)習(xí)的下一個(gè)熱點(diǎn)。
遷移學(xué)習(xí)也會(huì)帶來很多技術(shù)革新。比如我們可以在一些小數(shù)據(jù)上面應(yīng)用大數(shù)據(jù)得到的結(jié)果,在一個(gè)領(lǐng)域得到一個(gè)非常好的模型,可以把它遷移到周邊一些小數(shù)據(jù)模型,這個(gè)也是人類學(xué)習(xí)的一個(gè)有效模式。
遷移學(xué)習(xí)也可以使得模型的可靠性得到加強(qiáng)。一個(gè)模型產(chǎn)生了,我們可以讓它在不同場合都適用,這個(gè)模型就更加可靠。
再有越來越多的個(gè)性化需求,在場景當(dāng)中經(jīng)常聽到這樣的名詞,千人千面,這樣一個(gè)場景可以用遷移學(xué)習(xí)實(shí)現(xiàn)。比如如果在云端得到一個(gè)通用的模型,可以把它適配到各個(gè)終端,使它在不同的終端就有不同模型體現(xiàn),這樣就實(shí)現(xiàn)一個(gè)個(gè)性化。
它帶來的另外一個(gè)好處就是遷移學(xué)習(xí)可以解決隱私問題,每一個(gè)終端用戶都不必把他的個(gè)性化數(shù)據(jù)上傳到云端就可以得到它的結(jié)果。
遷移學(xué)習(xí)不一定是一步到位,從一個(gè)模型遷移到一個(gè)場景,我們可以通過一系列場景把一個(gè)模型遷移到不同的更廣泛范圍,比方說一個(gè)手段就是用深度學(xué)習(xí)來做遷移學(xué)習(xí),這也是我最近一個(gè)研究方向。
一個(gè)實(shí)際應(yīng)用是最近斯坦福大學(xué)和聯(lián)合國共同做了一個(gè)應(yīng)用,利用衛(wèi)星圖片分析非洲大陸不同地區(qū)的貧困程度。利用這種所謂傳遞式遷移學(xué)習(xí),就大量節(jié)省了人力。過去是要派一些觀察員到本地去做各種積累、各種調(diào)查,現(xiàn)在就用衛(wèi)星圖片把白天和晚上的地球圖象加以比對,最后訓(xùn)練出一個(gè)模型,大大節(jié)省了人力。
這里我們看到這些技術(shù)可能的革新,這些技術(shù)革新和商業(yè)應(yīng)用方向有哪些是最契合的?這里我要特別提金融方向。我們之前提過,一個(gè)是閉環(huán)的路徑要短,一個(gè)是溝通要高頻,最后要有復(fù)合效應(yīng)產(chǎn)生,很快讓模型能夠變得壯大。
人工智能在金融中的應(yīng)用
金融就是這樣一個(gè)領(lǐng)域。我不用多說大家也明白,在金融里面有各種各樣的場景,和用戶溝通的場景、金融安全、活體識(shí)別、人臉識(shí)別、聲音識(shí)別、行為識(shí)別等等。在后端,可以對用戶整個(gè)風(fēng)險(xiǎn)進(jìn)行分析,是不是應(yīng)該借貸。做一筆投資,在這筆投資之前要進(jìn)行風(fēng)險(xiǎn)分析,現(xiàn)在基于大數(shù)據(jù)和人工智能可以自動(dòng)產(chǎn)生這樣的分析,像個(gè)人和企業(yè)征信。
另外運(yùn)營、投顧方面都可以借助于人工智能大量加強(qiáng)提高效益。經(jīng)濟(jì)本身就是一個(gè)不斷提高效益的過程?,F(xiàn)在人工智能又為經(jīng)濟(jì)效益的提升提供了一個(gè)強(qiáng)大動(dòng)力。剛剛講的風(fēng)險(xiǎn)管理這里面又分監(jiān)控、識(shí)別、評估和干預(yù),每一個(gè)方面都可以有大量的人工智能參與。
一個(gè)很有趣的例子是從京東金融本身實(shí)踐得來的,就是人工智能可以幫助養(yǎng)雞,是一個(gè)非常有趣的應(yīng)用。
過去一個(gè)養(yǎng)殖戶用 12 塊錢養(yǎng)一只雞,需要提前貸款,貸一筆很大的款放在那兒,這個(gè)時(shí)候就產(chǎn)生了很大利息支出,這對養(yǎng)雞戶是一筆很大的費(fèi)用。但是在雞成長過程中,小雞不需要吃那么多飼料,只有長大的時(shí)候才吃。不同的雞對不同飼料需求也不一樣。
當(dāng)我們能夠掌握這個(gè)過程的時(shí)候,我們就可以把放貸變得因地制宜,在一開始養(yǎng)雞戶不需要借這么多錢,過去逐次增加。所以如果我們能夠做到按日計(jì)息就可以做到這一點(diǎn),就能夠大大提升效率?,F(xiàn)在京東金融可以做到 6 分錢就養(yǎng)一只雞,用人工智能算法來做分析。
同時(shí),我剛剛提到推薦系統(tǒng),大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)當(dāng)前共有的一個(gè)問題是過擬合,這是為什么呢?這是因?yàn)樵诩夹g(shù)上,它沒有照顧到兩個(gè)需求,一個(gè)是準(zhǔn)確性需求,一個(gè)是多樣性需求。
現(xiàn)在我們在研一個(gè)強(qiáng)化學(xué)習(xí)模型,能夠把兩個(gè)需求全部照顧到,這個(gè)名詞叫遷移的匪徒模型。用這個(gè)模型既照顧到準(zhǔn)確率,又照顧到多樣性,就把過擬合的問題徹底解決。
最后,我要說一下 JDD 背后是一個(gè)大賽,同時(shí)在中美兩邊進(jìn)行。在學(xué)術(shù)界大家都聽說過KDD即數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn),這樣的大會(huì)已經(jīng)有 20 多年的歷史,而且每一年都有一個(gè)大賽,就是由工業(yè)界出題,也變成了我們發(fā)現(xiàn)一些優(yōu)秀團(tuán)隊(duì)的一個(gè)方式。
今年的 JDD 也采用了這樣一個(gè)在金融方面的機(jī)會(huì)。今年的機(jī)會(huì)來自三個(gè)方面,都是緊貼著金融應(yīng)用。
一是登陸的行為識(shí)別。要發(fā)現(xiàn)有沒有可能是欺詐行為,這里面需要深度學(xué)習(xí),需要了解一些金融知識(shí),所以需要兩方面知識(shí)。這也是 JDD 大賽的一個(gè)特點(diǎn),我們不僅要技術(shù)上的革新,同時(shí)也需要這些參賽隊(duì)伍能寫出一個(gè)商業(yè)計(jì)劃,能把商業(yè)場景想清楚。
二是金融界非常關(guān)鍵的一個(gè)需求,就是信貸需求預(yù)測,還有店鋪銷量預(yù)測。
還有一個(gè)非常有趣的識(shí)別——豬臉識(shí)別,不是人臉識(shí)別。
豬臉識(shí)別是需要做什么呢?首先我們可以獲取到大量數(shù)據(jù),而不用擔(dān)心隱私問題,我們想豬可能不太關(guān)心隱私,同時(shí)又是一個(gè)活體識(shí)別問題。
這確確實(shí)實(shí)背后有一個(gè)商業(yè)場景問題,可以設(shè)想一下,假如有學(xué)生參加這個(gè)比賽,一個(gè)場景就是它可以幫助養(yǎng)豬戶鑒別不同的豬在養(yǎng)殖過程中的各種活動(dòng),這個(gè)豬是不是活躍,它是不是散養(yǎng)的或者它還是一只非常不愛動(dòng)的豬,由此對健康就可以作決策,對保險(xiǎn)就可以作預(yù)測。
另外消費(fèi)者可能也會(huì)有挑選,有人可能喜歡不同的豬肉,可能對豬的鑒別就有個(gè)性化需求。所以這既有深度學(xué)習(xí)應(yīng)用,又有商業(yè)應(yīng)用,是非常有趣的一個(gè)題目。
我們很期待這樣一個(gè)學(xué)術(shù)界和金融界的結(jié)合。
*雷鋒網(wǎng)整理
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。