關(guān)于AQF小編今天來(lái)給大家分享一些新手們?cè)诹炕顿Y中應(yīng)該要注意的幾個(gè)錯(cuò)誤區(qū),可能有些新手在操作的時(shí)候就算犯了這些錯(cuò)誤都不知道,所以小編今天就來(lái)跟大家說一下。
1、幸存者偏差(Survivorship bias)
幸存者偏差是投資者面對(duì)的很普遍問題之一,而且很多人都知道幸存者偏差的存在,但很少人重視它所產(chǎn)生的效果。我們?cè)诨販y(cè)的時(shí)候傾向于只使用當(dāng)前尚存在的公司,這就意味我們剔除了那些因?yàn)槠飘a(chǎn)、重組而退市的公司的所產(chǎn)生的影響。
在對(duì)歷史數(shù)據(jù)進(jìn)行調(diào)整時(shí),一些破產(chǎn)、退市、表現(xiàn)不佳的股票定期都會(huì)被剔除。而這些被剔除的股票沒有出現(xiàn)在你策略的股票池里,也就是說對(duì)過去做了回測(cè)時(shí)只利用了現(xiàn)在成分股的信息,剔除了那些在未來(lái)因?yàn)闃I(yè)績(jī)或者股價(jià)表現(xiàn)不好而被剔除出成分股中股票的影響。
也就是說當(dāng)我們使用過去30年中表現(xiàn)很好的那些公司進(jìn)行回測(cè)時(shí),即便一些公司當(dāng)時(shí)的信用風(fēng)險(xiǎn)高,當(dāng)你知道誰(shuí)會(huì)幸存下來(lái)時(shí),于是在信用風(fēng)險(xiǎn)高或者陷入困境時(shí)買入,收益非常高。若考慮進(jìn)那些破產(chǎn)、退市、表現(xiàn)不佳的股票后,結(jié)論則會(huì)完全相反,投資高信用風(fēng)險(xiǎn)企業(yè)的收益率長(zhǎng)期遠(yuǎn)低于信用穩(wěn)健的企業(yè)。
2、前視偏差(Look-ahead bias)
作為“七宗罪”之一的幸存者偏差是我們站在過去的時(shí)點(diǎn)上無(wú)法預(yù)知哪些公司能幸存下來(lái)并依舊是今天的指數(shù)成分股,而幸存者偏差僅僅是前視偏差的一種特例。前視偏差是指在回測(cè)時(shí),使用了回測(cè)當(dāng)時(shí)還不可用或者還沒有公開的數(shù)據(jù),這也是回測(cè)中很常見的錯(cuò)誤。
前視偏差的一個(gè)很明顯的例子就體現(xiàn)在財(cái)務(wù)數(shù)據(jù)上,而對(duì)財(cái)務(wù)數(shù)據(jù)的修正則更容易造成難以發(fā)現(xiàn)的錯(cuò)誤。一般來(lái)說,每個(gè)公司財(cái)務(wù)數(shù)據(jù)發(fā)布的時(shí)間點(diǎn)不同,往往存在滯后。而在回測(cè)時(shí)我們往往根據(jù)每個(gè)公司數(shù)據(jù)發(fā)布的時(shí)間點(diǎn)去評(píng)估公司財(cái)務(wù)狀況。
但是,當(dāng)時(shí)點(diǎn)數(shù)據(jù)(Point-in-time data,簡(jiǎn)稱PIT data)不可獲得時(shí),財(cái)務(wù)報(bào)告的滯后假設(shè)往往是錯(cuò)誤的。
在我們進(jìn)行回測(cè)的時(shí)間點(diǎn),終值往往尚無(wú)可知,只能使用初始值進(jìn)行分析??赡苡行┤苏J(rèn)為微小的修正并不會(huì)影響結(jié)論,但實(shí)際情況顯示:很多宏觀數(shù)據(jù)根據(jù)初值進(jìn)行回歸結(jié)果并不顯著,公司財(cái)務(wù)數(shù)據(jù)的調(diào)整將對(duì)選股結(jié)果產(chǎn)生直接影響。
(15).jpg)
3、講故事(The sin of storytelling)
一些人喜歡沒有任何數(shù)據(jù)就開始講故事,做量化的人喜歡拿著數(shù)據(jù)和結(jié)果講故事。兩種情況有很多類似之處,擅長(zhǎng)講故事的人或者說擅長(zhǎng)解釋數(shù)據(jù)結(jié)果的人往往在得到數(shù)據(jù)之前,內(nèi)心已經(jīng)存在既定的腳本,只需要找到數(shù)據(jù)支撐即可。
回顧1997年-2000年和2000年-2002年兩段時(shí)間的美國(guó)科技成分股和Russell 3000指數(shù),我們會(huì)發(fā)現(xiàn)一個(gè)截然相反的結(jié)論。從1997-2000年間的美國(guó)科技成分股來(lái)看,利潤(rùn)率是一個(gè)很好的因子,且回測(cè)結(jié)果也十分可信,然而如果拉長(zhǎng)時(shí)間區(qū)間到2002年,我們會(huì)發(fā)現(xiàn)利潤(rùn)率指標(biāo)不再是一個(gè)好的因子。
但從Russell 3000指數(shù)的市場(chǎng)表現(xiàn)來(lái)看,我們卻得到了相反的結(jié)論,利潤(rùn)率指標(biāo)仍然是一個(gè)有效的因子,可見,股票池的選取和回測(cè)的時(shí)間長(zhǎng)短對(duì)因子的有效性判斷影響非常大。所以講故事的人并不能得到正確的結(jié)論。
市場(chǎng)中每天都在發(fā)現(xiàn)新的“好因子”,尋找永動(dòng)機(jī)。能夠發(fā)布出來(lái)的策略都是回測(cè)表現(xiàn)良好的。雖然講故事的人對(duì)歷史的解釋非常動(dòng)聽,但其對(duì)未來(lái)的預(yù)測(cè)幾乎沒用。
金融經(jīng)濟(jì)中的相關(guān)性和因果性往往很難弄得清楚明白,所以,當(dāng)我們做出和常識(shí)相?;蚴呛驮瓉?lái)判斷相符的結(jié)果時(shí),盡可能不要去做一名講故事的人。
所以一些量化金融分析師新手們?cè)诓僮髁炕顿Y的時(shí)候一定要有數(shù)據(jù)支撐。
4、數(shù)據(jù)挖掘(Data mining and data snooping)
數(shù)據(jù)挖掘可以說是目前備受關(guān)注的領(lǐng)域,基于海量的數(shù)據(jù)與計(jì)算機(jī)的算力支持,人們往往希望能夠得到難以察覺的“好因子”。但是原有的金融數(shù)據(jù)還未及海量,且交易數(shù)據(jù)并不滿足“低噪音”的數(shù)據(jù)前提。
》》點(diǎn)擊進(jìn)入學(xué)習(xí)量化投資入門特惠班
有時(shí)數(shù)據(jù)挖掘幾乎是無(wú)效的。因此,在構(gòu)建策略或者尋找“好因子”時(shí),我們都應(yīng)該有清晰的邏輯和動(dòng)機(jī),量化分析只是驗(yàn)證自己的邏輯或動(dòng)機(jī)的一種工具,而不是尋找邏輯的捷徑。一般而言,我們構(gòu)建策略或?qū)ふ乙蜃拥膭?dòng)機(jī)多源于金融學(xué)基礎(chǔ)理論知識(shí)、市場(chǎng)的有效性、行為金融學(xué)等領(lǐng)域。當(dāng)然,我們也并不否認(rèn)數(shù)據(jù)挖掘在量化領(lǐng)域的應(yīng)用價(jià)值。
5、信號(hào)衰減、換手率、交易成本
信號(hào)衰減指的是一個(gè)因子產(chǎn)生后對(duì)未來(lái)多長(zhǎng)時(shí)間的股票回報(bào)有預(yù)測(cè)能力。一般來(lái)說,高換手率和信號(hào)衰減有關(guān)。不同的股票選擇因子往往具有不同的信息衰減特征。越快的信號(hào)衰減往往需要更高的換手率去攫取收益。
然而,更高的換手率往往也意味著更高的交易成本。在組合構(gòu)建中添加換手率約束是一個(gè)相對(duì)簡(jiǎn)單的方法,但并不是理想的方法,因?yàn)閾Q手率限制有時(shí)會(huì)幫助我們鎖定收益,有時(shí)也會(huì)損害既定的組合表現(xiàn)。因此,權(quán)衡信號(hào)衰減、交易成本以及模型預(yù)測(cè)能力是構(gòu)建投資組合的關(guān)鍵。
那么,如何確定好的調(diào)整頻率呢?我們需要注意的是,收緊換手率約束并不意味著降低調(diào)整頻率。例如,我們常常聽到類似“我們是長(zhǎng)期價(jià)值投資者,我們預(yù)期持有股票3-5年。
因此,我們一年調(diào)整一次即可”。但是,信息往往來(lái)的很快,我們需要及時(shí)調(diào)整我們的模型和預(yù)期。即使我們的換手率約束很緊,我們?nèi)匀恍枰谶m當(dāng)時(shí)機(jī)加快調(diào)倉(cāng)頻率。下圖以一個(gè)衰減速度很快的因子的極端案例為例進(jìn)行說明。
當(dāng)每天收盤時(shí)買入當(dāng)天表現(xiàn)很差的100個(gè)股票,賣出過去的持倉(cāng),持續(xù)每日交易,回報(bào)率非常高。這里的錯(cuò)誤也是前視偏差,還沒收盤我們并不知道當(dāng)天哪些股票表現(xiàn)是很差的,即使用程序化交易,這種策略也是不可行。我們只能以每天開盤價(jià)買入昨天表現(xiàn)很差的100個(gè)股票。通過對(duì)比,以開盤價(jià)買入的策略幾乎一條直線。
6、異常值(Outliers)
傳統(tǒng)的異常值控制技術(shù)主要包括winsorization和truncation兩種,數(shù)據(jù)的標(biāo)準(zhǔn)化也可近似看做異常值控制的方法之一,標(biāo)準(zhǔn)化技術(shù)有可能對(duì)模型的表現(xiàn)產(chǎn)生顯著的影響。比如下圖中的標(biāo)普BMI韓國(guó)指數(shù)成分股的利潤(rùn)率,采用平均值、剔除1%、2%極值等方法的結(jié)果差異很大。宏觀數(shù)據(jù)中經(jīng)常出現(xiàn)此類問題,少數(shù)極值若不做預(yù)處理,會(huì)嚴(yán)重影響回歸結(jié)果。
雖然異常值有可能包含著有用的信息,但是大部分情況來(lái)看,他們并不包含有用信息。當(dāng)然,對(duì)于價(jià)格動(dòng)量因子來(lái)說是例外。
7、非對(duì)稱性
一般來(lái)說,做多因子策略時(shí)較常用的策略是多空策略,即做多好的股票同時(shí)做空差的股票??上У氖?,并不是所有的因子都是平等的,多數(shù)因子的多空收益特征存在不對(duì)稱性,加之做空可能存在的成本和現(xiàn)實(shí)可行性,也給量化投資造成了不小的困擾。
.jpg)




