每位潛在的系統(tǒng)量化交易者必須決定使用哪款軟件。考慮到可供出售或訂閱的有上千種系統(tǒng),不可能每個(gè)人都知道哪種會(huì)提供一個(gè)好的風(fēng)險(xiǎn)收益比。人類是被資源束縛的代理人,也就是說:人們能力有限,數(shù)據(jù)不完全、心智的掌握不足、處理數(shù)據(jù)困難,加上決策本身的多變量復(fù)雜性,做出選擇的時(shí)間有限,人們很難自己來做出合乎邏輯的、理性的決定。為了克服先天不足,人們使用偏見過濾器來簡(jiǎn)化和加速?zèng)Q策過程。
量化交易員在瀏覽海量的業(yè)績(jī)報(bào)告、股票曲線、學(xué)術(shù)論文、開專業(yè)研討會(huì)以及遇到千載難逢的機(jī)會(huì)時(shí),必需客觀的意識(shí)到偏見的存在。這篇文章的主題是伴隨著系統(tǒng)的開發(fā)中出現(xiàn)的固有的偏見,以及它最臭名昭著的結(jié)果:過度擬合。
曲線擬合是數(shù)學(xué)中的一個(gè)概念。例如,給定坐標(biāo)對(duì)(0,1)和(5,4),求出他們的直線方程。依據(jù)線性方程“上升運(yùn)行”的定義用代數(shù)方法求解,最終以:y=mx+b的形式給出答案
在二維中更復(fù)雜的線需要更復(fù)雜的技術(shù)。將一些在同一條直線附近分布的點(diǎn)擬合成一條直線的過程稱為曲線擬合。他涉及到使用一種算法生成一個(gè)多項(xiàng)式(或函數(shù))產(chǎn)生一條相交于圖上所有點(diǎn)的直線。許多不同的多項(xiàng)式方程可以滿足對(duì)圖中所有點(diǎn)相交的基本要求。算法在端點(diǎn)之間找到一個(gè)等式,這個(gè)等式可以囊括中間的點(diǎn)。你可以插值來得到在你原始點(diǎn)之間的線上的新點(diǎn)的答案,只要你保持在端點(diǎn)之間就行。這就是本質(zhì)上曲線擬合的全部?jī)?nèi)容。
現(xiàn)在,當(dāng)你嘗試著使用這個(gè)多項(xiàng)方程式得到在原始邊界之外的一個(gè)點(diǎn)上時(shí),你開始做所謂的外推。當(dāng)你外推出用于生成多項(xiàng)式的邊界時(shí),你會(huì)得到預(yù)測(cè)錯(cuò)誤。越界越遠(yuǎn),錯(cuò)誤越嚴(yán)重。
量化交易系統(tǒng)的不同之處在于:量化交易系統(tǒng)并不把所有的數(shù)據(jù)點(diǎn)放在一張圖表上。我們可以認(rèn)為金融市場(chǎng)的數(shù)據(jù)充斥著帶有噪聲的信號(hào)。基于一些有效的前提,函數(shù)和規(guī)則用于開發(fā)一個(gè)系統(tǒng),用這個(gè)系統(tǒng)來描述某種類型的市場(chǎng)價(jià)格行為或者是趨勢(shì)。這意味著我們是曲線擬合,盡管是松散的,我們想要一個(gè)寬松的量化交易系統(tǒng),而不是嚴(yán)格的匹配。我們捕捉到信號(hào)的一些可獲利的特性,同時(shí)拒絕大部分的噪音,由此產(chǎn)生的系統(tǒng)應(yīng)該在外推效果上做得好,也就是說:運(yùn)行時(shí)達(dá)到預(yù)期設(shè)計(jì)的目標(biāo),脫胎于開發(fā)時(shí)涉及的數(shù)據(jù)。
回測(cè)過度擬合是一種的錯(cuò)誤的擬合,它對(duì)于量化交易系統(tǒng)與歷史數(shù)據(jù)的聯(lián)系過于緊密,以求獲利較高,損失最低。其實(shí),從開發(fā)交易系統(tǒng)的開始,開發(fā)者就是默認(rèn)交易系統(tǒng)具有盈利可能的,且其偏好將一直影響開發(fā)過程。開發(fā)者越是根據(jù)歷史數(shù)據(jù)引入增利減損的新算法,其初始偏好便體現(xiàn)得越強(qiáng)。如果此過程重復(fù)次數(shù)過多,且利用了大多數(shù)或全部歷史數(shù)據(jù),即會(huì)導(dǎo)致所謂的回測(cè)過度擬合。開發(fā)者甚至可能不曾意識(shí)到在如此的開發(fā)過程中,量化系統(tǒng)受其偏好的影響已經(jīng)越來越大,而只會(huì)認(rèn)為自己是在最大化地增利減損。>>>點(diǎn)擊咨詢AQF證書含金量

.jpg)
.jpg)
金程推薦: AQF就業(yè)前景 AQF年薪 量化金融分析師年薪
AQF考友群:760229148
金融寬客交流群:801860357
微信公眾號(hào):量化金融分析師




