0
本文作者: 溫曉樺 | 2016-11-14 14:55 |
圖片來(lái)源:epochtimes
“做私募(基金)的朋友在離開(kāi)公募(基金)的大平臺(tái)后面臨很多問(wèn)題,沒(méi)有IT環(huán)境、研究環(huán)境,缺乏運(yùn)營(yíng)環(huán)境,建立自己一套平臺(tái)或者環(huán)境需要大量的投入?!蓖?lián)數(shù)據(jù)CEO王政曾在采訪中表示:“我們看到了這樣的行業(yè)趨勢(shì),所以從2012年開(kāi)始籌備通聯(lián)數(shù)據(jù),幫助私募解決運(yùn)營(yíng)、研究、投資和管理上的需求。”
通聯(lián)數(shù)據(jù)(DataYes)是萬(wàn)向集團(tuán)投資成立的一家金融資訊和投資管理服務(wù)公司,該公司希望通過(guò)大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)等信息技術(shù),為資產(chǎn)管理人提供新的金融資訊和投資研究數(shù)據(jù)分析服務(wù)。前不久,該公司獲得了中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院頒發(fā)的“中國(guó)人工智能金融行業(yè)領(lǐng)軍企業(yè)獎(jiǎng)”。
在2012年正是P2P互聯(lián)網(wǎng)金融這樣的新金融火起時(shí),多年以前就布局金融領(lǐng)域謀求轉(zhuǎn)型的萬(wàn)向集團(tuán),選擇的卻是“最底層”領(lǐng)域,包括今日看見(jiàn)的區(qū)塊鏈、人工智能大數(shù)據(jù)平臺(tái)等。要知道,曾經(jīng)的P2P如今營(yíng)收融資都以?xún)|為單位計(jì)算,只是互聯(lián)網(wǎng)金融這些場(chǎng)景化為主行業(yè),如今面臨著迫切的技術(shù)變革的要求和挑戰(zhàn)。
萬(wàn)向控股副董事長(zhǎng)肖風(fēng),也是通聯(lián)數(shù)據(jù)董事長(zhǎng),曾任博時(shí)基金總經(jīng)理,他稱(chēng),“互聯(lián)網(wǎng)金融熱起來(lái)時(shí),我們?cè)谙胄碌慕鹑跇I(yè)態(tài),新的金融形態(tài)我們投不投?當(dāng)時(shí)考慮的過(guò)程當(dāng)中,我們認(rèn)為萬(wàn)向這樣一個(gè)集團(tuán)去做P2P的話是沒(méi)有場(chǎng)景優(yōu)勢(shì)的。沒(méi)有場(chǎng)景硬上P2P或者眾籌就可能走歪了,現(xiàn)在看到很多人已經(jīng)走歪了?!彼跃C合考慮后,萬(wàn)向集團(tuán)決定不做P2P。
那么,互聯(lián)網(wǎng)IT技術(shù)+金融,放下區(qū)塊鏈不說(shuō),在這個(gè)“言必稱(chēng)大數(shù)據(jù)、人工智能”的時(shí)代,萬(wàn)向旗下專(zhuān)注于資產(chǎn)管理創(chuàng)新的通聯(lián)數(shù)據(jù),又在做些什么呢?
通聯(lián)數(shù)據(jù),如今剛剛從萬(wàn)向大廈搬離至新的辦公樓,“原來(lái)的地方坐不下了?!睋?jù)悉,過(guò)去三年到現(xiàn)在,通聯(lián)數(shù)據(jù)花費(fèi)3.5億元,將團(tuán)隊(duì)擴(kuò)充至200余人,并建立了多個(gè)基于云的底層數(shù)據(jù)平臺(tái)。
在底層數(shù)據(jù)庫(kù)之上,通聯(lián)數(shù)據(jù)又構(gòu)建了兩個(gè)云平臺(tái),蘿卜投研和優(yōu)礦,其中蘿卜投研是針對(duì)基金經(jīng)理和研究員提供智能投資研究數(shù)據(jù)服務(wù)的平臺(tái),而優(yōu)礦則是一個(gè)眾包的、分享式的金融數(shù)據(jù)量化平臺(tái)。它們主要對(duì)海量投資需要的信息進(jìn)行降噪、歸類(lèi)和推薦,通過(guò)機(jī)器學(xué)習(xí)、文本挖掘提供投資分析中需要的輿情分析。用戶(hù)可以從中獲取數(shù)據(jù)分析,搭建自己的交易策略并共享。
優(yōu)礦界面
把各類(lèi)數(shù)據(jù)集中一起,并依靠數(shù)據(jù)、機(jī)器學(xué)習(xí)模型將其作用于投資分析,通聯(lián)數(shù)據(jù)智能投研總監(jiān)向偉表示, “我們做大數(shù)據(jù)驅(qū)動(dòng)的基本面投研,是期望能夠從市場(chǎng)上海量的、高頻的、更細(xì)力度的數(shù)據(jù)當(dāng)中,去抽象挖掘一定的機(jī)制,把超越人腦能夠分析的大數(shù)據(jù)當(dāng)中所蘊(yùn)含的價(jià)值進(jìn)行提純。最終對(duì)接基本面投研所需要的假設(shè)?!?/p>
據(jù)介紹,通聯(lián)數(shù)據(jù)現(xiàn)在的數(shù)據(jù)來(lái)源分為三部分,一部分自己搜集整理,二是從第三方購(gòu)買(mǎi),第三種是數(shù)據(jù)商把數(shù)據(jù)整合過(guò)來(lái)放在云平臺(tái),有用戶(hù)使用則向數(shù)據(jù)商繳費(fèi)的模式。這些數(shù)據(jù)對(duì)接了滬深股市/期權(quán)、債券、基金、咨詢(xún)、研究報(bào)告等,并提供API開(kāi)放給外界。對(duì)于主要發(fā)力點(diǎn)在數(shù)據(jù)端及數(shù)據(jù)質(zhì)量?jī)?yōu)化,肖風(fēng)表示,“我覺(jué)得這是一個(gè)方向,在現(xiàn)在人工智能逐漸興起的這個(gè)階段,創(chuàng)辦工業(yè)數(shù)據(jù)的深度學(xué)習(xí)技術(shù),是相當(dāng)有必要的?!?nbsp;
而通聯(lián)數(shù)據(jù)的團(tuán)隊(duì)配置,據(jù)介紹主要包括兩類(lèi)人:一類(lèi)是金融背景的人才,這些人此前是資產(chǎn)管理機(jī)構(gòu)的研究員、基金經(jīng)理,如金融工程董事總經(jīng)理薛昆,他原是瑞士銀行投行全球量化團(tuán)隊(duì)董事及摩根大通量化研究團(tuán)隊(duì)副總裁;另一類(lèi)是互聯(lián)網(wǎng)人才,一般來(lái)自谷歌、微軟、阿里等互聯(lián)網(wǎng)巨頭,如智能投研總監(jiān)向偉,他曾任百度個(gè)性化搜索負(fù)責(zé)人。
眾所周知,私募基金面臨硬件、軟件、數(shù)據(jù)、運(yùn)營(yíng)等系統(tǒng)的大量建設(shè),后續(xù)硬件換代的維護(hù)和升級(jí)也非常麻煩,時(shí)間成本和資金成本很高?!耙酝哪J绞琴I(mǎi)硬件買(mǎi)軟件,招IT人來(lái)搭建系統(tǒng),資金、時(shí)間、人力成本居高不下。而基于云的金融投資管理的IT服務(wù)平臺(tái)只需要注冊(cè)登記即可使用,可以做基金管理完整業(yè)務(wù),包括收集整理數(shù)據(jù)、研究、交易、風(fēng)控、估值結(jié)算等全部都有?!蓖?lián)數(shù)據(jù)CEO王政介紹,一家大中型基金公司每年的IT投入至少幾千萬(wàn),甚至上億,而采取租用集中了多類(lèi)數(shù)據(jù)源的平臺(tái)的形式,“成本至少可以減少一半?!蓖跽群髶?dān)任彭博資訊研究部經(jīng)理、巴克萊全球投資公司基金經(jīng)理、博時(shí)基金股票投資部總經(jīng)理、ETF及量化投資總監(jiān)等職,作為一名過(guò)來(lái)人,他深有體會(huì)。
此外,智能投研總監(jiān)向偉表示,傳統(tǒng)基金研究員的工作是刀耕火種式的,盯數(shù)據(jù)、拉研報(bào)等等,要花費(fèi)很高的時(shí)間和人力成本?!耙粋€(gè)研究員盯一家公司可能不覺(jué)得有什么,但假如一次盯三十家就會(huì)覺(jué)得很累;如果一下要盯一百家甚至五百家呢?這下就抓狂了。但其實(shí)這對(duì)機(jī)器來(lái)說(shuō)是可以批量去做的?!痹谡麄€(gè)投資研究的過(guò)程中,“里面每一個(gè)點(diǎn)都可以找出一些原則問(wèn)題來(lái)自動(dòng)化完成,比如從開(kāi)始的尋找數(shù)據(jù)、鑒別數(shù)據(jù)的真?zhèn)涡院蛢r(jià)值,以及如何從大數(shù)據(jù)當(dāng)中精選篩選出一些合情的小數(shù)據(jù)等。讓人來(lái)做幾個(gè)樣本給機(jī)器學(xué)習(xí),比如說(shuō)采集一些媒體、流量數(shù)據(jù),機(jī)器學(xué)習(xí)到這些模板后可以批量去做,把各個(gè)品類(lèi)的數(shù)據(jù)都采集到。 ”
“所以說(shuō),機(jī)器的加入不是要取代人,而是提高研究的效率,節(jié)省成本?!?/p>
然而,在投資研究的過(guò)程中,找數(shù)據(jù)只是完成第一個(gè)任務(wù),在接下來(lái)的環(huán)節(jié)中,機(jī)器學(xué)習(xí)又有何用處呢?
比如數(shù)據(jù)清理完后需要建立模型。向偉稱(chēng):“建立模型中各家的打法也不一樣,所以我們會(huì)去市場(chǎng)看看,主要的買(mǎi)方和賣(mài)方各家的數(shù)據(jù)分析方法有哪些?數(shù)據(jù)做回歸、預(yù)測(cè)和相關(guān)性分析一般會(huì)有哪些方法?……無(wú)論哪家研究所,這些基礎(chǔ)工具都差不多,所以我們會(huì)做一些原子化的底層數(shù)據(jù)分析,把更多的自由度留給上層的研究員,讓他們?nèi)テ唇?、組合,來(lái)相互佐證?!?/p>
那這個(gè)層面機(jī)器能做哪些事呢?“現(xiàn)在我們并不缺idea,而是idea太多,每天都會(huì)有各種各樣的研報(bào)會(huì)發(fā)表,這就存在了去偽存真的需要。所以,首先機(jī)器能夠做的是:回測(cè)誰(shuí)才是專(zhuān)家;或者誰(shuí)擅長(zhǎng)建哪一類(lèi)的模型、應(yīng)該信任哪一類(lèi)的模型——機(jī)器能夠通過(guò)回測(cè)來(lái)進(jìn)行量化層面的鑒定?!?/p>
而完成去偽存真的第一步后,機(jī)器開(kāi)始需要進(jìn)行一些深度學(xué)習(xí)知識(shí)層面的問(wèn)題?!芭e個(gè)例子,要對(duì)一家賣(mài)藥的上市公司的業(yè)績(jī)進(jìn)行預(yù)判,人分析的過(guò)程應(yīng)該是:賣(mài)哪一種藥?市場(chǎng)格局大概是怎樣?賣(mài)得好的地域是哪里?是直銷(xiāo)的還是經(jīng)銷(xiāo)?……從各個(gè)維度去篩選并拼接。這對(duì)機(jī)器來(lái)說(shuō)是一件困難的事情,但機(jī)器可以學(xué)習(xí)——它可以解析這些研報(bào)當(dāng)中的語(yǔ)義結(jié)構(gòu),比如其中什么預(yù)判或觀點(diǎn)使用了哪一些數(shù)據(jù)去支撐。這些邏輯關(guān)系讓人來(lái)做幾遍給機(jī)器看,機(jī)器就可以批量解析。然后再配合大型的量化框架,就能知道哪一套分析方法靠譜,或者有足夠數(shù)據(jù)支撐?!?/p>
“建立模型這個(gè)過(guò)程可淺可深,也與研究員的段位相關(guān)。 一般機(jī)構(gòu)研究一個(gè)基金或者股票,他們會(huì)先安排一個(gè)助理,讓其去看數(shù)十篇研報(bào)。一個(gè)也許比較初階,而且對(duì)行業(yè)也不熟悉的助理,在看完數(shù)十篇研報(bào)之后也能夠拿出一篇基本的財(cái)務(wù)預(yù)測(cè)報(bào)表,只是這個(gè)報(bào)表預(yù)測(cè)的方差有可能比較大,需要額外佐證其偏差之處,以及需要微調(diào)的幅度大概有多少等問(wèn)題。而在這個(gè)過(guò)程中,機(jī)器也可以用來(lái)解析研報(bào)、金融數(shù)據(jù)和財(cái)務(wù)類(lèi)數(shù)據(jù),來(lái)組織一個(gè)邏輯關(guān)系,然后像搭積木一樣,拼出一個(gè)粗略的模型出來(lái)。當(dāng)然這個(gè)模型有可能比較有缺陷,但它可以線上和分析師產(chǎn)生交互,讓他們觀測(cè)機(jī)器是根據(jù)哪一塊數(shù)據(jù)修正了哪一些假設(shè),使得這個(gè)預(yù)測(cè)方差更小。”
再往后就是決策環(huán)節(jié),需要去做離線回測(cè),來(lái)量化風(fēng)險(xiǎn)和收益。“其實(shí)本質(zhì)是有一個(gè)離線價(jià)值網(wǎng)絡(luò)來(lái)評(píng)價(jià)風(fēng)險(xiǎn)。有了這套離線框架的話,就可以每天人在睡覺(jué)的時(shí)候,機(jī)器仍不斷地左右互搏進(jìn)行演練,包括模型選擇、參數(shù)選擇。機(jī)器學(xué)習(xí)做完交易決策后,人要對(duì)其進(jìn)行擬合、復(fù)盤(pán)等?!?/p>
所以說(shuō),“相當(dāng)于這是一個(gè)人機(jī)交互的過(guò)程,在這個(gè)過(guò)程中人和機(jī)器都是互相成長(zhǎng)和迭代的。人在機(jī)器的配合下可以分析人本身存在的軟肋,從而做得比單純?nèi)藖?lái)做要好。人可以停,機(jī)器不可以停,這些就是機(jī)器超越人的表現(xiàn)。我們不是說(shuō)讓機(jī)器取代人,而是在某些方面可以顯著性地超越人腦。”
不過(guò)當(dāng)然,如今人工智能、機(jī)器學(xué)習(xí)技術(shù)的發(fā)展仍在早期階段,自然語(yǔ)言處理尚未有質(zhì)的突破,機(jī)器的準(zhǔn)確性、魯棒性(穩(wěn)健性、強(qiáng)健性)還要克服很多挑戰(zhàn)。向偉坦言,這是一個(gè)漸進(jìn)的過(guò)程,所以一開(kāi)始人會(huì)干預(yù)的多一點(diǎn),但是隨著人工正負(fù)反饋積累得越多,機(jī)器學(xué)習(xí)模型的魯棒性會(huì)逐漸增強(qiáng)。
而從風(fēng)控的角度講,薛昆稱(chēng),金融的本質(zhì)是風(fēng)控?!拔覀冏罱K給客戶(hù)提供的是贏的概率。在這個(gè)過(guò)程中,無(wú)論是基本面分析,還是主動(dòng)投資,需要關(guān)注的是怎么用一套非常成熟的體系來(lái)告訴客戶(hù)其風(fēng)險(xiǎn)歸因、業(yè)績(jī)歸因是什么。也就是說(shuō),這套體系可以告訴客戶(hù)他在賭什么,比如主動(dòng)投資的組合的基金經(jīng)理,也可以從風(fēng)控的角度去看他押注哪些因子、哪些風(fēng)格;量化投資的基金經(jīng)理在做研究的過(guò)程中,無(wú)論是交易前還是交易后,也都可以根據(jù)其來(lái)審視,包括其中的風(fēng)險(xiǎn)因子有沒(méi)有風(fēng)險(xiǎn)漂移等事情發(fā)生。 ”
“風(fēng)控體系的好壞在于時(shí)間的考驗(yàn)——經(jīng)歷的時(shí)間越長(zhǎng)就越好。某些特定的資產(chǎn)類(lèi)別和策略是很難去評(píng)估其風(fēng)險(xiǎn),這也是需要時(shí)間去積累的?!?/span>
資產(chǎn)管理業(yè)的“人工智能+”目前出現(xiàn)兩個(gè)方向:一個(gè)是to B——智能投研,一個(gè)是to C——智能投顧。包括國(guó)內(nèi)巨頭、初創(chuàng)公司,最初多選擇面向C端的服務(wù),但在許多質(zhì)疑之下,許多尤其是初創(chuàng)公司的智能投顧服務(wù)也逐漸顯現(xiàn)出強(qiáng)弩之末之勢(shì)。
“其實(shí)兩年前我們就開(kāi)始做to C的智能投顧,但做一段時(shí)間后把這個(gè)項(xiàng)目暫時(shí)停掉了。因?yàn)槲覀冇X(jué)得中國(guó)還沒(méi)到這個(gè)智能投顧的階段,”薛昆稱(chēng),智能投顧在美國(guó)之所以可行,是因?yàn)槊绹?guó)市場(chǎng)的被動(dòng)化投資已經(jīng)發(fā)展到一定程度,其市場(chǎng)足夠有效,因此智能投顧真正不用花很大的成本,只要押注某些因素就可以了,而且這些東西是可以程序化、模型化的。但相比較之下,現(xiàn)在中國(guó)還是一個(gè)非常非常不有效的市場(chǎng),而且中國(guó)可配置的資產(chǎn)實(shí)質(zhì)上不多。
“現(xiàn)在大家都在講‘資產(chǎn)荒’,但事實(shí)上不是資產(chǎn)荒,而是Beta荒。其實(shí)還是有Alpha的,但Alpha的特點(diǎn)是你要找到一些獨(dú)特的投資機(jī)會(huì)?!盇lpha是指絕對(duì)收益,一般是資產(chǎn)管理人通過(guò)證券選擇和時(shí)機(jī)選擇獲得;Beta收益指相對(duì)收益,是管理人通過(guò)承擔(dān)系統(tǒng)風(fēng)險(xiǎn)獲得的收益。
薛昆表示,“如果服務(wù)C端(智能投顧),一定要是在貝塔市場(chǎng)非常好的時(shí)候才可以做到,因?yàn)槟莻€(gè)時(shí)候才能規(guī)?;_@其實(shí)是策略容量的問(wèn)題,一個(gè)策略能夠規(guī)?;拍芊?wù)C端?!?/p>
“所以,現(xiàn)在Beta荒的市場(chǎng)上,你要找到一個(gè)特別好的資產(chǎn)類(lèi)別去服務(wù)長(zhǎng)尾C端的客戶(hù),像螞蟻金服和百度金融的智能投顧服務(wù),他們也會(huì)很痛苦,因?yàn)闆](méi)有辦法超越金融的本質(zhì),他們其實(shí)也在尋找各種各樣的(Beta)資產(chǎn)。”
回到前面,怎么找到這些產(chǎn)生Alpha的投資機(jī)會(huì)呢?薛昆補(bǔ)充道:“量化投資中有一個(gè)叫時(shí)間因素的東西,即當(dāng)市場(chǎng)有了些賺錢(qián)的信號(hào),但這些信號(hào)不是在每一個(gè)市場(chǎng)環(huán)境都可以工作,面對(duì)這種情況,先驗(yàn)的知識(shí)大部分都在基金經(jīng)理的大腦里,看行業(yè)數(shù)據(jù)的時(shí)候自己腦袋里會(huì)有這樣一些模型——什么時(shí)候該用什么信號(hào)來(lái)構(gòu)建組合并做調(diào)整。那這些基金經(jīng)理的知識(shí)能不能由機(jī)器來(lái)學(xué)習(xí)呢?現(xiàn)在的結(jié)論是可以的。但前提是,你要有賺錢(qián)的信號(hào)。這就是為什么說(shuō)到技術(shù)要跟非常專(zhuān)業(yè)的框架在一起工作。這些信號(hào)有些是來(lái)自于基本面,或者大數(shù)據(jù)?!迸e個(gè)例子,如果要預(yù)測(cè)一個(gè)港口的出貨量,傳統(tǒng)的方法需要統(tǒng)計(jì)學(xué)統(tǒng)計(jì)概率來(lái)預(yù)測(cè),但是機(jī)器就可以直接調(diào)用衛(wèi)星圖等數(shù)據(jù)。
“這些非結(jié)構(gòu)的數(shù)據(jù)都可以轉(zhuǎn)化成結(jié)構(gòu)化的數(shù)據(jù),快數(shù)據(jù)可以預(yù)測(cè)慢數(shù)據(jù),機(jī)器也可以快人一步地做一些預(yù)測(cè)性的事情。從這些數(shù)據(jù)當(dāng)中提取出來(lái)的信號(hào)會(huì)成為Manager Alpha的來(lái)源?!?/p>
“所以,在人工智能推進(jìn)傳統(tǒng)資管業(yè)進(jìn)步的角度上,我們的做法是幫助基金經(jīng)理在基本面分析或量化這一過(guò)程找到Alpha,在資產(chǎn)端創(chuàng)新。因?yàn)閺牟呗缘慕嵌瓤词袌?chǎng)是輪動(dòng)的,可能今年上半年做Alpha的人不太好做,反而做CTA的活得很滋潤(rùn),那在這一個(gè)領(lǐng)域我們實(shí)質(zhì)上是創(chuàng)造一個(gè)能夠讓客戶(hù)能夠很快找到市場(chǎng)上什么策略才是有用的?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。