0
雷鋒網報道,在近日深圳舉辦的預見2018新財富新春投資策略會上,通聯(lián)數(shù)據(jù)金融工程董事總經理薛昆帶來了題為“機器智能時代的投資管理”的主題演講。據(jù)雷鋒網了解,薛昆曾任瑞士銀行投行全球量化團隊董事,摩根大通量化研究團隊副總裁,擁有十余年量化投資、金融平臺研發(fā)經驗。
通聯(lián)數(shù)據(jù)金融工程董事總經理薛昆
以下是薛昆演講原文,雷鋒網作了不改變原意的編輯:
今天我會結合行業(yè)趨勢和熱點來分享這個話題,比如區(qū)塊鏈。抽象來說,人工智能以及區(qū)塊鏈最終都是算法,現(xiàn)在的算法已經應用到大部分行業(yè),潛移默化改變我們的生活。
未來五到十年,金融行業(yè)、教育行業(yè)、汽車行業(yè)都會經歷算法帝國的崛起。總結來看就是三個方向:在線化、智能化、網絡化。
物聯(lián)網極大擴張了數(shù)據(jù)邊界,以后的數(shù)據(jù)會越來越多,現(xiàn)在只是一個起點。比如當新能源汽車、自動駕駛汽車在今年普及開來以后,數(shù)據(jù)的邊界將會超過手機邊界。以后能夠產生數(shù)據(jù)的模式將是非常有吸引力的模式,因為在未來數(shù)據(jù)會變成最重要的生產要素。
在線化和網絡化會使得數(shù)據(jù)極度擴張,區(qū)塊鏈和AI技術將會極大推動這個進程。在任何一個產業(yè),“黑洞效應”都會使得產業(yè)鏈蓬勃發(fā)展。而在智能化和網絡化當中,最重要的是兩個技術:區(qū)塊鏈、人工智能。
從2008年比特幣白皮書發(fā)布,2015年以太坊誕生,到如今,區(qū)塊鏈世界發(fā)生了翻天覆地的變化,也涌現(xiàn)出了很多區(qū)塊鏈2.0技術。今年有一個非常重要的趨勢——區(qū)塊鏈將從2.0過渡到3.0階段,3.0會帶來更快的網絡。
另外一項重要技術是大數(shù)據(jù)與人工智能。大數(shù)據(jù)與人工智能存在差異,但是在概念上兩個聯(lián)系緊密。因為人工智能依賴于大數(shù)據(jù),如果沒有數(shù)據(jù),很多算法都只是流于表層。語音識別、自然語言處理、Chatbot、知識圖譜,底層都是依賴于大數(shù)據(jù),離開大數(shù)據(jù),這些都是無源之水。
在自動駕駛領域也是如此。我們可以看到一個趨勢,相關公司現(xiàn)在也越來越趨于自己去收集數(shù)據(jù)。現(xiàn)在BAT、谷歌可能會說,“我來給你提供算法,然后你到我的生態(tài)系統(tǒng)里面玩?!钡歉嗥髽I(yè)希望自己掌握數(shù)據(jù),自己設計數(shù)據(jù),數(shù)據(jù)直接上云。擁有這種技術的公司,未來會有非常高的壁壘。
一直以來,投資研究有兩大門派,一個是基本面門派,一個是量化門派。AI又能為這兩大門派做什么呢?
舉一個例子,在A股市場,每天都有超過50個上市公司的資本運作事件發(fā)生。中國工商登記注冊的公司數(shù)1000萬家,涉及的核心自然人超過500萬。如果人工地去分析資本運作,基本上是不可能的。但是機器可以非常容易地幫助人類做到這個事情。
知識圖譜可以幫助我們研究基本面。首先要有基礎數(shù)據(jù),即新聞公告研報數(shù)據(jù)、交易所披露數(shù)據(jù)、工商登記數(shù)據(jù),這些是AI的原料。然后我們利用知識圖譜用實體識別算法,可以把公司高管作為實體抽取出來,并抽取投資持股關系等,形成公司關系圖譜。有了這些數(shù)據(jù)以后,我們可以做關聯(lián)分析,比如同業(yè)競爭關系分析,高管能力均衡分析,實際控制人的分析,并且動態(tài)變更。
在量化投資領域,機器可以幫助量化研究員更好地挖掘數(shù)據(jù)。傳統(tǒng)投資研究,大家關注的都是各種結構化的數(shù)據(jù)。結構化的數(shù)據(jù)帶來的信息是有限的,大部分投資者都能看到這些數(shù)據(jù),所以你沒有提前效應。但如果在衛(wèi)星圖像上應用AI算法,比如實時監(jiān)測券商營業(yè)所門口的車輛數(shù)字,那么我們可以更早獲得一些幫助
另外,我們也可以用算法挖掘文本數(shù)據(jù)來輔助量化投資。面對海量的文本數(shù)據(jù),包括新聞、公告、研報、微博、雪球、股吧、互動易、論壇等,我們使用知識圖譜進行關聯(lián)分析。比如說,賈躍亭在回函中表示無力履行無息借款與增持承諾,“深表歉意”!通過情感分析算法,我們知道這樣的文本是利空的,這樣就可以幫助投資人很快的進行判斷。
怎么做到的呢?我們使用的算法是WordEmbedding+BiLSTM-CRF,召回率均在90%以上。而基于情感辭典的算法和基于機器學習的自動分類算法,我們可以做到情感分析,自動分類處理。情感分析算法主要采用XGBoost、SUM,情感分類準確召回率可以在75%以上。
除了基本面研究、量化研究,算法在大類資產配置也能發(fā)揮作用。
比如,在構建公募基金組合時,我們可以用機器學習去做基金收益率的預測,并基于歷史數(shù)據(jù)做統(tǒng)計風險模型。我們可以針對不同目標,產生最優(yōu)的基金組合,比如說目標風險下收益最大化、目標收益下風險最小化。
此外,還可以進行基金特征選擇。首先對所有的基金打標簽,我們給每個基金打上大約150個標簽,這150個標簽包含8個時間維度。然后用機器學習算法去做篩選。比如,我們可以計算基金池中每只基金當期收益率與前期各性能指標之間的相關系數(shù)ic,這是量化里面通用的算法。如果再往前滑動多期,得到每個前期性能指標與當期收益率的ic序列,再計算分別計算每個ic序列的均值ic序列得到最后結果。
總結一下,機器學習雖然有用,但是也不是萬能的。它的優(yōu)勢在于,它能夠建立非線性模型。當然問題也是隨之而來的,簡單模型的解釋度更高,人們更理解。所以大部分基金經理還是會選擇線性模型,因為比較容易理解。但是在一些特殊領域,比如知識圖譜,這是人腦沒有辦法掌控的,那就需要人機結合。其實人對小數(shù)據(jù)是更敏感的,有一些人做不了的事情可以用機器幫助我們。
Q&A:
Q:智能投顧對分析師帶來的挑戰(zhàn)主要體現(xiàn)在哪些方面?它還有哪些方面可以改進?
A:智能投顧對分析師帶來的挑戰(zhàn)更多體現(xiàn)在智能投研,因為智能投研跟分析師是相輔相成的。雖然機器算法的崛起替代了很多初級分析師的工作。但是高級分析師無法替代,人對趨勢的判斷和另類信息收集的能力比機器更強。未來的趨勢是,算法取代初級工作,高級分析師是如虎添翼。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。