丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
金融科技 正文
發(fā)私信給叨叨
發(fā)送

0

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

本文作者: 叨叨 2017-07-09 22:22 專題:GAIR 2017
導語:特別是做低級的投行從業(yè)者,他們每天都在撰寫各種金融文檔、各種募集說明書

雷鋒網(wǎng)按:光鮮亮麗的投行工作看似有著羨煞旁人的超高回報,但在幾百頁“金融文檔”的日常重壓之下,會被瞬間秒回原形。在中國計算機學會(CCF)主辦,雷鋒網(wǎng)與香港中文大學(深圳)承辦的 CCF-GAIR 2017 的第二天,中科院計算所副研究員、微信人工智能首席科學顧問、博士生導師羅平教授帶來了題為《人工智能在智能投行中的應用》的分享,講解了如何用 AI 來解救金融民工,給金融文檔的復核和撰寫帶來福音。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

以下為羅平演講速記全文整理,雷鋒網(wǎng)在不改變原意的基礎上做了精編:

非常榮幸參加 CCF-GAIR 2017 金融科技專場,特別是外地的同事,到這兒來的都是真愛,而且是一種緣分。為什么這樣說?昨天晚上我坐在飛機上,本來飛機已經(jīng)停了一兩個小時了,準備要飛了,結果北京下冰雹。我覺得可能沒有緣分跟大家見面了,但是它最終還是飛過來了,得以順利跟大家見面。

剛才主持人說希望跟大家講講干貨,我是做技術的,切入到金融行業(yè),希望能跟大家分享一些技術方面的干貨。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我的演講主題是《AI在智能投行中的應用》,任何的技術要切入到一個非常具體的場景才有價值。我們看看智能投行場景需要解決什么問題。

首先投行是做什么的呢?

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

其實投行是一個金融的媒介,它實際上是資金需求方和投資方的媒介,讓資金能夠順利的給到資金需求方。投行基本的工作有幾個步驟:

  • 承攬

  • 盡調與承做

  • 發(fā)行與承銷

  • 后續(xù)督導

這是從前臺到后臺的順序。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

知乎上有一個調查:整個金融行業(yè)什么樣的職位最苦逼,排在第一名的是投資銀行家,他們非常的苦,他們苦在哪兒呢?投行的從業(yè)者門檻非常高,每個人都必須要有光鮮的背景,都是海歸、或名校畢業(yè)。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

但是實際上他們每天都做著非??啾频墓ぷ?,特別是事業(yè)初期的投行從業(yè)者,每天都在撰寫各種金融文檔、各種募集說明書,包括債券募集說明書、IPO或者資產(chǎn)證券化說明書。這些說明書平均都是500頁以上,撰寫起來非常的痛苦。而且這些東西都有 Deadline,你不能錯過,錯過要等好幾個月才能重新審批。這么大的工作量,他們非常非常的痛苦。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

同時,金融監(jiān)管機構對文檔的質量要求非常高,有三個詞:真實、準確、完整,這是他們必須做到的基本原則。如果你沒有做到這個要求會有什么后果呢?

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017因為公開的金融文檔是具有一定法律效力的,公布出來的行業(yè)數(shù)據(jù)有錯誤,可能會承擔訴訟的連帶責任。監(jiān)管部門也會對文檔質量有非常高的要求。文檔質量往往關乎IPO是否能成功;文檔質量也是證監(jiān)會考評每個投資銀行的重要指標。如果級別從A降到B,投行每年將支付更多的監(jiān)管費用,這是很大的一筆運營成本。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

那么,我們來看看一些報道出來的金融文檔出錯的例子,大量的例子實際上是沒有報道出來的。

2011年,高盛的一個私募產(chǎn)品,里面存在數(shù)字方面的錯誤,帶來超過 4500 萬美金的賠償訴訟。另外,國內某銀行在財報中公布“負債8億億”,實際上是8萬億。該新聞上就有投資者質問:財報這么不負責任,我們也無法信賴所提供的金融服務。所以,金融文檔撰寫的操作風險高,所面臨的聲譽損失和經(jīng)濟損失非常大。

所以,撰寫這些文檔的投資銀行家們壓力山大。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

最苦逼的是什么呢?這個市場每年都在壯大,也就是說,投行從業(yè)者每年的工作量都在增加。這確實是一個深刻的痛點。我們看看能不能用AI技術來消除這些痛點。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們給這項技術取了一個很酷的名字,叫做庖丁解文。大家都知道一個成語叫庖丁解牛。我們希望AI技術能夠像庖丁一樣,干凈利落的把金融文檔結構化。

這項自然語言結構化的技術有三個特點

  • 瞬時:全自動的,都是機器自動做,沒有人工干預

  • 精準:非常準確

  • 深度:要把所有的語義,特別是金融數(shù)據(jù)間的勾稽關系,都解析出來。


中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我給大家舉一個例子:大量的金融文檔中都有一些對公司各種財務指標的描述。

實際上,這句話要讓機器去理解,是非常難的事情。大家都知道,現(xiàn)在機器翻譯是做得很好的,但其實機器翻譯沒有做任何理解,它可以把這句話翻譯成英文,但是你要是詢問:2014年公司第一大客戶的營業(yè)額是多少,翻譯程序是回答不了的。

如果要精確問答這樣的問題,機器需要做什么呢?需要把自然語言的描述都結構化。我們研發(fā)的深度結構化技術包含兩個層面:

  • 第一個層面是 Text2Tuple,從文本到元組。元組是時間、財務指標、值的三元組,比如說:2013、2014、2015年第一大客戶的營業(yè)額分別是多少錢,我們需要提取出來。

  • 第二個層面是 Text2Equ,我們需要把文本中這些比例數(shù)字,如60%、58%、55%,解釋為語義相同的計算公式;同時文中提到“呈現(xiàn)逐漸下降的趨勢”,所以,也需要提取出這個不等式的關系。

這就是我們的核心技術:從非結構化的文檔中自動提取出對應語義的元組和公式。因此,我們研發(fā)的模型,輸入為非結構化或半結構化的文本,輸出為可供計算機搜索、比對、分析的結構化的數(shù)據(jù)。這其實是自動構建知識圖譜的核心技術。有了知識圖譜,后續(xù)可以支撐很多應用。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們現(xiàn)在關注的是金融文檔復核的應用。什么是文檔復核呢?簡言之,就是對金融文檔中的數(shù)字的勾稽關系進行復核。任何公開的募集說明書都包含大量的數(shù)字,同樣的一個財務指標,它可能會在文字和表格中被多次描述。由于,撰寫過程可能多次修改原始數(shù)據(jù);這將導致數(shù)據(jù)前后不一致的情況。

復核文檔,英文叫 Authorized Reading,是投行業(yè)的一項重要工作。有了深度結構化技術,我們將能將這項工作完全自動化。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

舉一個實際的例子,文本中提到:發(fā)行人的固定資產(chǎn)在2014年是紅色的數(shù)字;但是在表格中,2014年的固定資產(chǎn)對應不上。這顯然是一個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

因此,我們研發(fā)了一個自動復核的產(chǎn)品,AutoDoc。使用起來很簡單,用戶只需上傳需要復核的金融文檔,經(jīng)過自動解析和比對,機器會自動標注出數(shù)據(jù)不一致的地方。

效果怎么樣呢?我們在1000個已公開的債券募集說明書上進行測試和人工確認。測試結果是令人驚訝的。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們發(fā)現(xiàn)這1000個募集說明書里面,有68.92%的文檔存在錯誤,平均包含4.26個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

有了這樣的測試,我們在4月26日把這個功能發(fā)布在微信公眾號 “債有主”上。到目前為止,已經(jīng)有近1000份募集說明書上傳。我們的數(shù)據(jù)是:98.4%的文檔存在錯誤,平均每個文檔中有6.5個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們解密一下這項功能背后究竟是什么樣的技術。實際上,我們打造一個 NeuSALG 的平臺,什么是 SALG 呢?就是 Semantic Acquisition和 Language Generation。這個平臺最核心的一點是打造一個通路平臺,溝通標注、訓練、預測、反饋4個部分。只有數(shù)據(jù)在通路中反復扭轉,系統(tǒng)的性能才會越來越好。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

其實,性能的突破并不是單點的突破,需要從底層深度學習框架、模型能力、數(shù)據(jù)等各方面發(fā)力。這也是我們多年研究的積累。比如,在優(yōu)化算法方面,今年我們在 KDD 上發(fā)表了一項研究,能夠動態(tài)確定隨機梯度下降每輪所需數(shù)據(jù)的大小,這一研究能夠減少多機多卡的環(huán)境下進行訓練的通信開銷,從而減少訓練時間。這將大幅度提供模型的迭代速度。


中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

最后,我想給大家一些對 FinTech 和 AI 的思考。我覺得金融科技應該特別關注金融業(yè)務場景的中后臺,其實金融這個領域非常大,它有各式各樣的業(yè)務場景。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

比如說,在投行領域,從前臺到后臺的流程是承攬、盡調與承做、發(fā)行與承銷或者后續(xù)督導。承攬的工作,通常需要跟發(fā)行人和客戶打交道,這是靠關系、靠人脈的,這個環(huán)節(jié)機器做不了,而機器能做的是中后臺的業(yè)務。又比如,二級市場的資金業(yè)務,從交易、風控到清算與結賬。

我覺得金融科技應該在中后臺的業(yè)務領域里面發(fā)揮作用。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

為什么?我們發(fā)現(xiàn),金融中后臺的這些工作有兩個特點:第一是每天都做同樣的事,重復的做;第二個特點是:單次工作的難度相對較低。例如:對一句話進行復核,這是很簡單的事情。

但是,整個任務的難度是兩個方面的乘積, W是完成單次任務的難度,Dur是持久性難度系數(shù)。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們需要指出:單次完成任務的難度,需要區(qū)分人和機器的差異。我們看看,人擅長什么,機器擅長什么。機器擅長計算、存儲、檢索,只要插上電,機器就能完成。但是,機器不擅長下棋、不擅長聽、說、寫、理解。阿爾法狗做的事情是把下棋這個事情轉換成一個計算的問題,一旦完成這樣的轉換,人是永遠都不能夠戰(zhàn)勝機器的。

但是對于人來講,下棋是非常難的,計算、邏輯推理稍微簡單一點;最簡單的是聽說讀寫,就是每個人的基本功能,但是這個事情恰恰是機器難以做到的。

當前AI技術的成功,實際都是“弱人工智能”的勝利,它實質是將所謂的“智能”功能轉化為計算的問題。

中科院羅平演講全文:自動撰寫金融文檔如何實現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

所以,我們現(xiàn)在想做的事情,實際上是把人類的聽說讀寫和理解的智能功能轉換成計算的過程。如果完成了這樣的轉換,那么機器就能反復運行,一切都會變得簡單。

因此,我們的愿景是:把 paperwork 變成 happywork;釋放人力,讓投資銀行家們完成更多創(chuàng)造性的有價值的工作。

謝謝大家!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

分享:
相關文章

編輯

雷鋒網(wǎng)北京編輯。關注人工智能,略雜。微信(yougo5654)可以找到我。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說