隨著科技越來越發(fā)達,人工智能也正在快速的走進我們的身邊,當然金融領(lǐng)域人工智能也在慢慢的延伸。
接下來我們會分三期就人工智能和金融領(lǐng)域的結(jié)合做一系列分析,厘清人工智能在金融領(lǐng)域已經(jīng)都做了哪些嘗試,以及成果:
運用人工智能進行量化交易;
人工智能輔助金融新聞、報告、投資意向書的半自動化生產(chǎn);
人工智能進行行業(yè)、企業(yè)的語義搜索。
量化交易從很早開始就運用機器進行輔助工作,分析員通過編寫簡單函數(shù),設(shè)計一些指標,觀察數(shù)據(jù)分布,而這些僅僅把機器當做一個運算器來使用。直到近些年機器學(xué)習(xí)的崛起,數(shù)據(jù)可以快速海量地進行分析、擬合、預(yù)測,人們逐漸把人工智能與量化交易聯(lián)系得愈發(fā)緊密。我們可以把量化交易按照人工智能的子領(lǐng)域(機器學(xué)習(xí),自然語言處理,知識圖譜)分為三個階段。
一.機器學(xué)習(xí)
.png)
分析員們對財務(wù)、交易數(shù)據(jù)進行建模,分析其中顯著特征,利用回歸分析等傳統(tǒng)機器學(xué)習(xí)算法預(yù)測交易策略。這種方式有兩個主要弊端,其一是數(shù)據(jù)不夠豐富,僅限于交易數(shù)據(jù),更重要的是它受限于特征的選取與組合(Feature Engineering),模型的好壞取決于分析員對數(shù)據(jù)的敏感程度。此外一種做法是,模仿專家的行為,選擇某一領(lǐng)域的特定專家,復(fù)制他們的決策過程,并導(dǎo)入可重復(fù)的計算框架。
代表公司:

總部位于紐約的Rebellion Research在2007年推出了第一個純?nèi)斯ぶ悄?AI)投資基金。該公司的交易系統(tǒng)是基于貝葉斯機器學(xué)習(xí),結(jié)合預(yù)測算法,響應(yīng)新的信息和歷史經(jīng)驗從而不斷演化,有效地通過自學(xué)習(xí)完成全球44個在股票、債券、大宗商品和外匯上的交易。
日本的初創(chuàng)公司Alpaca,他們的交易平臺Capitalico利用基于圖像識別的深度學(xué)習(xí)技術(shù),允許用戶很容易地從存檔里找到外匯交易圖表并幫忙做好分析,這樣一來,普通人就能知道明星交易員是如何做交易的,從他們的經(jīng)驗中學(xué)習(xí)并作出更準確的交易。
倫敦的對沖基金機構(gòu)Castilium由金融領(lǐng)域大佬與計算機科學(xué)家一同創(chuàng)建,包括前德意志銀行衍生品專家、花旗集團前董事長兼首席執(zhí)行官和麻省理工的教授。他們采訪了大量交易員和基金經(jīng)理,復(fù)制分析師、交易員和風險經(jīng)理們的推理和決策過程,并將它們納入算法中。
坐落在香港的Aidyia致力于用人工智能分析美股市場,依賴于多種AI的混合,包括遺傳算法(genetic evolution),概率邏輯(probabilistic logic),系統(tǒng)會分析大盤行情以及宏觀經(jīng)濟數(shù)據(jù),之后會做出自己的市場預(yù)測,并對的行動進行表決。
全球的對沖基金橋水聯(lián)合(Bridgewater Asspcoates),使用一種基于歷史數(shù)據(jù)與統(tǒng)計概率的交易算法,讓系統(tǒng)能夠自動學(xué)習(xí)市場變化并適應(yīng)新的信息。與其類似的公司還有Point72 Asset,Renaissance Technologies, Two Sigma。
二.自然語言處理
人們發(fā)現(xiàn)僅僅從數(shù)字推測模型是不夠的,開始考慮引入新聞,政策,社交網(wǎng)絡(luò)中的豐富文本并運用自然語言處理技術(shù)分析,將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化處理,并從中探尋影響市場變動的線索。這方面直接用于投資交易的并不多,更多是用于風控與征信。通過爬取個人及企業(yè)在其主頁、社交媒體等地方的數(shù)據(jù),一來可以判斷企業(yè)或其產(chǎn)品在社會中的影響力,比如觀測App下載量,微博中提及產(chǎn)品的次數(shù),在zhihu上對其產(chǎn)品的評價;此外將數(shù)據(jù)結(jié)構(gòu)化后,也可推測投資的風險點。這方面國內(nèi)的很多互聯(lián)網(wǎng)貸款,征信公司都在大量使用自然語言處理技術(shù),例如宜信,閃銀等。另外一些公司則利用這些技術(shù)進行B端潛在客戶的搜尋,如Everstring,并將信息出售給其上游公司。
代表公司:
.png)
CommEq是今年6月份在倫敦新設(shè)的一家基于人工智能(AI)的對沖基金。CommEq的投資方法結(jié)合了定量模型與自然語言處理(NLP),使計算機能夠如人類一樣通過推斷和邏輯演繹理解不完整和非結(jié)構(gòu)化的信息。
由李嘉誠與塔塔通訊投資的Sentient Technologies運用自然語言處理,深度學(xué)習(xí)(Deep Learning)等多種AI技術(shù),進行量化交易模型的建立。
Kensho是美國一家基于云計算的智能計算機系統(tǒng)先鋒公司。Kensho 結(jié)合自然語言搜索,圖形化用戶界面和云計算,為金融市場的投資人們提供一套全新的數(shù)據(jù)分析工具——Warren。Warren 能夠回答復(fù)雜的金融市場問題,如各種數(shù)據(jù)、股票走向等,可回答約 100 萬種關(guān)于全球事件對股價影響的英文問題。》》》點擊學(xué)習(xí)量化交易長久更新班
三.知識圖譜
上述技術(shù)經(jīng)常會在一些意外發(fā)生的時候預(yù)測失敗,例如911、熔斷機制和賣空禁令等等。人工智能系統(tǒng)沒有遇到過這些情況,無法從歷史數(shù)據(jù)中學(xué)習(xí)到相關(guān)模式。這時候如果讓人工智能管理資產(chǎn),就會有很大的風險。此外,機器學(xué)習(xí)擅長發(fā)現(xiàn)數(shù)據(jù)間的相關(guān)性而非因果性。很有名的一個例子是早在1990年,對沖基金First Quadrant發(fā)現(xiàn)孟加拉國生產(chǎn)的黃油,加上美國生產(chǎn)的奶酪以及孟加拉國羊的數(shù)量與標準普爾500指數(shù)自1983年開始的10年時間內(nèi)均具有99%以上的統(tǒng)計相關(guān)性,1993年之后,這種關(guān)系莫名其妙的消失了。這就是由于自學(xué)習(xí)的機器無法區(qū)分虛假的相關(guān)性所導(dǎo)致的,這時候就需要專家設(shè)置的知識庫(規(guī)則)來避免這種虛假相關(guān)性的發(fā)生。
知識圖譜本質(zhì)上是語義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu),根據(jù)專家設(shè)計的規(guī)則與不同種類的實體連接所組成的關(guān)系網(wǎng)絡(luò)。知識圖譜提供了從“關(guān)系”的角度去分析問題的能力。就金融領(lǐng)域來說,規(guī)則可以是專家對行業(yè)的理解,投資的邏輯,風控的把握,關(guān)系可以是企業(yè)的上下游、合作、競爭對手、子母公司、投資、對標等關(guān)系,可以是高管與企業(yè)間的任職等關(guān)系,也可以是行業(yè)間的邏輯關(guān)系,實體則是投資機構(gòu)、投資人、企業(yè)等等,把他們知識圖譜表示出來,從而進行更深入的知識推理。

目前知識圖譜在金融中的應(yīng)用大多在于風控征信,基于大數(shù)據(jù)的風控需要把不同來源的數(shù)據(jù)(結(jié)構(gòu)化,非結(jié)構(gòu))整合到一起,它可以檢測數(shù)據(jù)當中的不一致性,舉例來說,借款人張三和借款人李四填寫的是同一個公司電話,但張三填寫的公司和李四填寫的公司完全不一樣,這就成了一個風險點,需要審核人員格外的注意。
而以新三板投資為例,知識圖譜可以將企業(yè)的投融資、上下游,競爭等關(guān)系關(guān)聯(lián)起來,從而展示出一家企業(yè)在行業(yè)中的全貌。如下圖所示,我們可以看到德瑞鋰電的客戶惠州德賽是國資委投資的,這就符合某些投資人的邏輯,是一個投資亮點。此外還可以看到,德瑞鋰電的材料供應(yīng)商是什么情況,以多少比例從注冊資本多少的企業(yè)供貨,這也可以判斷企業(yè)是否可以持續(xù)穩(wěn)定的生產(chǎn)。
以投資關(guān)系為例,知識圖譜可以將整個股權(quán)沿革串起來,方便地展示出哪些PE機構(gòu)在哪一年進入,進入的價格是多少,是否有對賭條款,這些信息不僅可以判斷該機構(gòu)進入當時的估值,公司未來的發(fā)展情況(公司成長的節(jié)奏),還可以看清PE機構(gòu)的投資偏好,投資邏輯是如何變更發(fā)展的。
目前知識圖譜在工業(yè)界還沒有形成大規(guī)模的應(yīng)用。即便有部分企業(yè)試圖往這個方向發(fā)展,但很多仍處于調(diào)研階段。我們認為這其中的難點在于如何與特定領(lǐng)域機構(gòu)建立起一套合作方式,如何將合作變成一種可輕易編程的界面,讓領(lǐng)域?qū)<铱梢酝ㄟ^系統(tǒng)以一種非常簡單的方式進行行業(yè)邏輯的建模,而他的邏輯可以通過系統(tǒng)實時得到驗證,使其進一步更新,只有通過專家與機器反反復(fù)復(fù)的迭代,形成閉環(huán),才會服務(wù)好用戶。
代表公司有:

知識圖譜在金融早的應(yīng)用代表是Garlik。這家公司2005年成立于英國,核心成員來自南安普頓大學(xué)(University of Southampton,是語義網(wǎng)的核心研究機構(gòu)之一),主要業(yè)務(wù)是在線個人信息監(jiān)控。他們收集網(wǎng)絡(luò)和社交媒體上的個人信息,當發(fā)生個人信息盜竊時Garlik會及時報警。2011年他們被美國的三大個人信用記錄公司之一Experian收購,其技術(shù)被用于個人信用記錄、信用盜竊的分析。Garlik的核心技術(shù)之一是大規(guī)模語義數(shù)據(jù)庫,前后開源發(fā)布了3store, 4store, 5store等高性能數(shù)據(jù)庫。
Palantir,估值僅次于Uber的科技創(chuàng)業(yè)公司,曾用大數(shù)據(jù)幫助CIA干掉本·拉登。他們有一個基于知識圖譜的金融數(shù)據(jù)分析平臺—Palantir Metropolis,可以整合多源的量化資料,并提供一套方便易用的分析工具來滿足復(fù)雜的研究需求,其中的組件能夠進行復(fù)雜搜索,可視化編輯與分析,有非常豐富的人機交互能力。》》》點擊學(xué)習(xí)量化交易策略




