機(jī)器學(xué)習(xí)(非傳統(tǒng)統(tǒng)計(jì)方法如回歸)在量化金融方面有哪些應(yīng)用?如果你去搜索早期的神經(jīng)網(wǎng)絡(luò)、SVM的相關(guān)論文,會(huì)發(fā)現(xiàn)不少是做股票預(yù)測(cè)的。原因很簡(jiǎn)單,因?yàn)樗坪跷覀兛梢蕴烊坏匕压善蓖顿Y的問(wèn)題看成一個(gè)分類(lèi)問(wèn)題或者回歸問(wèn)題?;貧w的角度,我們可以根據(jù)之前的歷史數(shù)據(jù),預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的股價(jià);分類(lèi)的角度,我們可以根據(jù)歷史數(shù)據(jù),預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)股價(jià)的正負(fù)??雌饳C(jī)器學(xué)習(xí)的方法可以完美適用了。不過(guò)這個(gè)結(jié)論顯然是錯(cuò)的,因?yàn)槿绻娴耐昝肋m用,那么機(jī)器學(xué)習(xí)的大牛們怕是已經(jīng)賺發(fā)了以致無(wú)心學(xué)術(shù)。
那么,問(wèn)題在哪里?量化金融分析師AQFer認(rèn)為大家沒(méi)有太多關(guān)注機(jī)器學(xué)習(xí)算法能夠奏效的假設(shè)(assumption)。以分類(lèi)問(wèn)題為例,分類(lèi)算法能夠奏效的假設(shè)是在同一類(lèi)下,樣本數(shù)據(jù)應(yīng)該是獨(dú)立同分布(i.i.d).的。而股票價(jià)格數(shù)據(jù)特點(diǎn)就是,股票收益率曲線(xiàn)的自相關(guān)性(autocorrelation)極低,噪聲大,而且不穩(wěn)定(stationary)。如果明白了這兩點(diǎn),我們?cè)倩剡^(guò)頭去看這類(lèi)文章的思路,就發(fā)現(xiàn)了問(wèn)題。絕大部分文章在提取特征方面基本沒(méi)下什么功夫,就靠股票的return的信息來(lái)構(gòu)成pattern。這樣,因?yàn)楣善笔找媲€(xiàn)的不穩(wěn)定、高噪聲、低相關(guān)性,使得最終做成的模式(pattern)沒(méi)法滿(mǎn)足在同一類(lèi)的情況下i.i.d的條件,因此,這類(lèi)方法的失敗也是必然的。如果你仔細(xì)觀察,會(huì)發(fā)現(xiàn)這類(lèi)文章喜歡使用IBM啊MSFT啊這樣的股票做實(shí)驗(yàn),為什么?因?yàn)檫@種頂級(jí)公司股票的價(jià)格比較穩(wěn)定,噪聲少,相關(guān)性強(qiáng)。
不過(guò),近年來(lái)已經(jīng)有一些研究者開(kāi)始從別的角度思考問(wèn)題。傳統(tǒng)的機(jī)器學(xué)習(xí)方法使用的基本是是股票的日線(xiàn)圖和月線(xiàn)圖。實(shí)際的股票交易大部分是使用限價(jià)訂單(limit order book)的,一些能夠得到數(shù)據(jù)的研究者,開(kāi)始思考將機(jī)器學(xué)習(xí)的方法應(yīng)用于限價(jià)訂單層次的數(shù)據(jù)上,典型的論文就是今年新晉的ACM fellow,Michael Kearns在ICML06上發(fā)表的Reinforcement learning for optimized trade execution 不同于之前的論文,這篇文章試圖為歷史數(shù)據(jù)的每一個(gè)時(shí)間點(diǎn)構(gòu)建狀態(tài)(state),這樣可以將增強(qiáng)學(xué)習(xí)的框架應(yīng)用其中。這提供了與以前截然不同的思路,不過(guò)也并沒(méi)有從假設(shè)的層面證實(shí)文章的方法確實(shí)是適應(yīng)限價(jià)訂單數(shù)據(jù)性質(zhì)的。

在種種的失敗之后,開(kāi)始有一些機(jī)器學(xué)習(xí)領(lǐng)域的研究者認(rèn)識(shí)到,如果想在股票投資的問(wèn)題上成功,似乎不能夠獨(dú)立于股票數(shù)據(jù)固有的性質(zhì)。于是開(kāi)始有一些方法,試圖利用股票數(shù)據(jù)既有的性質(zhì),來(lái)設(shè)計(jì)在線(xiàn)學(xué)習(xí)(online learning)的算法。典型的是之前NTU計(jì)算機(jī)系的PhD, Bin Li在ICML,IJCAI的一系列論文。他的核心其實(shí)就是抓住了股票的均值回歸(mean reversion)的性質(zhì)。簡(jiǎn)單的理解,均值回歸認(rèn)為股票有它自己的隱含價(jià)值,股價(jià)在這個(gè)值附近波動(dòng)。他的這一系列論文,其實(shí)就是在怎么找這個(gè)'均值'方面有些許變化。在時(shí)間點(diǎn)t,最開(kāi)始他認(rèn)為這個(gè)均值就是t-1的股價(jià),后來(lái)他又認(rèn)為這個(gè)均值是過(guò)去一個(gè)窗口時(shí)間上的均值。這些論文的思路、算法都很簡(jiǎn)單容易理解,但是包含的思想是前人不曾有過(guò)的,就是利用股票數(shù)據(jù)的性質(zhì)設(shè)計(jì)算法,而不是硬將數(shù)據(jù)往既有的機(jī)器學(xué)習(xí)算法里套。他現(xiàn)在已經(jīng)憑借這些論文在武大金融系當(dāng)上了副教授。
一家基金公司,通常會(huì)同時(shí)運(yùn)行好多種策略進(jìn)行投資。這就產(chǎn)生了另外一個(gè)問(wèn)題,應(yīng)該如何給這些策略動(dòng)態(tài)地分配權(quán)值?機(jī)器學(xué)習(xí)領(lǐng)域有很多類(lèi)似的問(wèn)題,比如我要做一個(gè)分類(lèi)問(wèn)題,我有好多個(gè)分類(lèi)器,如何集成(ensemble)它們使得它們的表現(xiàn)比較好?關(guān)于多種策略的權(quán)值問(wèn)題,Das在KDD11的paper,Meta optimization and its application to portfolio selection中有詳細(xì)的討論。這類(lèi)方法被稱(chēng)為Meta-Learning Algorithm。
現(xiàn)如今的股票交易已經(jīng)比幾十年前要復(fù)雜的多,催生了很多新的交易場(chǎng)所和交易類(lèi)型。這也給機(jī)器學(xué)習(xí)的專(zhuān)家們很多的機(jī)會(huì)。典型的例子是Michael Kearns在UAI09年發(fā)表的Censored exploration and the dark pool problem。這篇文章是描述暗池交易的,我在另一個(gè)回答里也提到過(guò)。向某個(gè)暗池提交v股的交易量,如果實(shí)際成交量小于v,我們知道其容量;而如果實(shí)際交易量就是v,則只能知道其實(shí)際容量是大于v的。假使在某時(shí)刻,我們需要在K個(gè)暗池中交易V手股票,我們就需要根據(jù)歷史數(shù)據(jù)推斷哪些暗池的容量大,在這些暗池里我們就多投入。如果暗池的容量都stochastic的,是不是就是另外一個(gè)更復(fù)雜的故事了?事實(shí)上已經(jīng)有很多后續(xù)的工作來(lái)講述這個(gè)故事,不過(guò)不是機(jī)器學(xué)習(xí)界,而來(lái)自主流的金融工程界和運(yùn)籌學(xué)界。
那么機(jī)器學(xué)習(xí)界最為紅火的深度學(xué)習(xí)(deep learning)在這個(gè)問(wèn)題上是否有所斬獲?前一陣子看新聞?wù)f,已經(jīng)有幾個(gè)人利用DL的技術(shù)開(kāi)了家對(duì)沖基金公司,賺了很多錢(qián)。那么DL問(wèn)題在交易上的作用可能體現(xiàn)在哪里?我自己沒(méi)事兒也YY過(guò)這個(gè)問(wèn)題,我覺(jué)得可能是在統(tǒng)計(jì)套利方面。最簡(jiǎn)單的統(tǒng)計(jì)套利方法是看股價(jià)的相關(guān)性,比如A和B兩只股票價(jià)差一向穩(wěn)定在10塊錢(qián),某天價(jià)差突然跌倒5塊錢(qián),統(tǒng)計(jì)套利就假設(shè),這個(gè)價(jià)差會(huì)恢復(fù)到10塊錢(qián),那么我們就可以就此設(shè)計(jì)交易策略。如果股價(jià)價(jià)差真的恢復(fù)了,那么就可以實(shí)現(xiàn)套利。但是顯然,這樣的關(guān)系可能不是那么明顯地存在于股票的價(jià)格中,可能存在于收益曲線(xiàn)中或者方差曲線(xiàn)中,甚至更高復(fù)雜度的統(tǒng)計(jì)量中。DL提供了將原數(shù)據(jù)投影到另一個(gè)特征空間中的方法,而且是高度非線(xiàn)性的。那么,原數(shù)據(jù)中沒(méi)有體現(xiàn)出來(lái)的相關(guān)性,會(huì)不會(huì)在這種高度非線(xiàn)性的投影空間中體現(xiàn)出來(lái)呢?如果有體現(xiàn),是不是能夠設(shè)計(jì)交易策略實(shí)現(xiàn)套利呢?
這是我自己的一點(diǎn)點(diǎn)思考。
.jpg)

>>>點(diǎn)擊咨詢(xún)雙十一課程減免活動(dòng)
.jpg)
完善下表,48小時(shí)內(nèi)查收全套AQF備考資料
.jpg)
金程推薦: AQF考試 AQF報(bào)名 AQF培訓(xùn)
聲明▎更多內(nèi)容請(qǐng)關(guān)注微信號(hào)量化金融分析師。原創(chuàng)文章,歡迎分享,若需引用或轉(zhuǎn)載請(qǐng)保留此處信息。




