AQF大家應該都知道是一個證書的簡稱,但是這個證書的知識體系也是不簡單的,小編今天給大家說的就是AQF量化投資因子回溯測試的總體框架,看上去名字很長,但是這個總體框架是怎樣的呢?一起去看看。
目前的因子分析方法一般包括兩方面:
1、 對因子收益率和 IC 的篩選:
◆ 收益率:要求勝率或者 Top-Bottom 收益率超過設定值;
◆ IC:要求 IC 或者 T 檢驗超過設定值。
2、 對因子的單調性或者區(qū)分度的限制:
◆ 單調性:要求因子收益率隨因子的增加具有一定的單調性;
◆ 區(qū)分度: 要求因子的不同分位數(shù)組合的收益率具有一定的差距。
如果只從上述角度考慮,對因子的分析就僅僅局限于靜態(tài)分析:
(1) 沒有考慮因子有效性的時間變化:因子的有效性具有時變性,隨著持有期的變化因子的有效性是不斷變化的,不同因子的有效性呈現(xiàn)出不同的衰變規(guī)律;
(2) 沒有考慮環(huán)境或者風格板塊對因子有效性的影響: 因子的有效性在不同的股票池、不同的風格板塊上可能具有不同的規(guī)律,不同的宏觀環(huán)境下因子可能具有不同的特征。
(22).jpg)
針對上述缺陷,我重新設計了測試的框架,著重增加了對因子有效性的動態(tài)分析:
(1) 增加了對因子時間變化特征的分析:包括 IC 的分布、 IC 的衰變、自相關性的衰變、買入信號的保持或逆轉等內容;
(2) 增加了對因子的情境特征分析:包括不同股票池(指數(shù)成分股/行業(yè)/風格)上的因子選股分析,宏觀指標與因子組合的分析,不同市場階段上的因子表現(xiàn)等,目的是發(fā)現(xiàn)因子適應于什么樣的股票群體,什么樣的市場階段和宏觀環(huán)境。
其他考慮因素:
(1) 改進了數(shù)據(jù)清洗方法, 增加了平均絕對偏差方法;
(2) 設定了標準化/分位數(shù)/組合權重/殘余收益率四個層次,便于從不同角度過濾特定風格對因子的影響,實現(xiàn)風格中性化,例如對于行業(yè)影響,可以從因子的行業(yè)標準化、因子的行業(yè)分位、組合權重的行業(yè)中性和從個股收益率中直接剔除行業(yè)收益率四個方面剔除因子中的行業(yè)影響;
(3) 增加了初步的風險控制方面的內容:如因子回測的歷史變動、組合的跟蹤誤差以及組合業(yè)績的歸因等;
(4) 考慮了幸存者偏差: 各種股票池的設定, 根據(jù)的都是歷史成分股, 保證了回溯測試的有效性;
(5)詳細校訂了因子的信息公布時間:保證了因子的實時性;
(6)對增長因子,采用趨勢化的方法,避免采用算術增長率或者幾何增長率所造長的兩點偏差;
(7) 建立了初步的因子庫, 分為估值因子/成長因子/規(guī)模因子/動量因子/財務質量因子/技術因子/預測因子六個部分。
所以在了解或者是學習量化金融分析師AQF量化投資的時候這些影響因素也都應該要考慮,這樣學習出來的才足夠全面。
數(shù)據(jù)輸入
數(shù)據(jù)輸入部分, 主要工作包括數(shù)據(jù)的采集和整理、數(shù)據(jù)結構的設計, 生成后面因子分析所需的數(shù)據(jù)集。 測試所需的數(shù)據(jù)主要包括股票/指數(shù)/風格/宏觀四個方面, 對各類數(shù)據(jù)和因子, 我們進行了細致的處理和校對, 包括消除幸存者偏差、前視偏差等等。
樣本篩選
樣本篩選部分, 主要功能是實現(xiàn)對股票池的初步篩選, 在因子測試時, 設定了三條篩選規(guī)則:
1) 剔除選股日的 ST/PT 股票;
2) 剔除上市不滿一年的股票;
3) 剔除選股日由于停牌等原因而無法買入的股票。
當然,不同邏輯下可能會有不同的篩選,在這個測試框架下,允許添加對股票池的其他篩選,但是所有篩選都要在樣本篩選部分實現(xiàn)。
數(shù)據(jù)清洗
數(shù)據(jù)清洗部分, 主要功能是完成對因子和收益率數(shù)據(jù)的清洗。 數(shù)據(jù)清洗的目的是去掉可能的數(shù)據(jù)錯誤和極端數(shù)據(jù), 保證后面得到的模型具有穩(wěn)健性。
數(shù)據(jù)清洗的內容包括兩部分,即異常值的處理和缺失值的處理。
(1) 異常值的處理:
對于異常值的定義, 用一種更為穩(wěn)健的絕對中位偏差方法( MAD):
.png)
這里
是數(shù)據(jù)集。
實際上, 對于異常值的處理,不同的因子可能采用不同的方式, 可供選擇的處理方式包括定義為 NA 或者用相近值替代, 具體的處理方式取決于對異常值的邏輯解釋。
需要說明的是異常值只是一個相對概念,有許多不同的異常值定義方法,如對單因子異常值通常的定義方法是利用方差、中位數(shù)和四分位數(shù),具體剔除多少,選擇哪種方法,取決于數(shù)據(jù)本身的特征和對數(shù)據(jù)的主觀理解, 以及對敏感性和穩(wěn)健型的平衡。
(2) 缺省值的處理:
數(shù)據(jù)的缺失值有不同的來源,如有些是原始數(shù)據(jù)缺失,有些是異常值處理產生的。對缺失值的處理方式要依據(jù)缺失值的來源和邏輯解釋, 選取不同的操作,包括剔除或者替代。
分析計算
分析計算部分, 主要功能是完成對因子特征的各種分析。 對不同的因子,依據(jù)不同的邏輯,可以分不同層次設定因子分析的方式:
(1) 因子的標準化方法,新版測試中可供選擇的因子標準化方法包括四種:
(a)普通標準化方法,即通常求 z 值的方法;
(b)市值標準化方法, 相對于普通標準化方法,考慮了規(guī)模對均值的影響, 均值為市值加權平均數(shù);
(c) 隨機數(shù)標準化,根據(jù)因子的樣本分布隨機生成一個樣本,將隨機生成的樣本值依次賦給對應股票作為標準化后的因子值,優(yōu)點是可以將因子值轉換為服從特定分布的得分;
(d) 風格標準化,即將股票池劃分為不同的風格, 將每個股票的因子值用所屬
風格的風格平均值和風格標準差進行標準化,一個特例就是用不同行業(yè)的
行業(yè)均值和行業(yè)標準差進行因子的行業(yè)標準化。
(2) 因子的分位數(shù)方法,可供選擇的分位數(shù)方法有兩種:
(a) 普通分位數(shù)方法,即在整個股票池進行分位數(shù)計算;
(b) 風格分位數(shù)方法, 即在每個風格上進行分位數(shù)計算,然后構成整體股票池的分位數(shù)結果。
風格分位方法,能夠保證在每個分位組上,從數(shù)目上看各個風格是均勻分布的。風格分位的一個特例就是行業(yè)分位,即分別在每個行業(yè)上進行分位數(shù)計算,從而保證各個分位組中的行業(yè)分布在數(shù)目上是均勻的。
(3) 組合的權重方法,可供選擇的組合權重方法有三種:
(a) 等權重方法,即組合中的每個股票具有同等的權重;
(b) 市值加權方法,即組合中的股票權重取決于股票的市值大?。?/p>
(c) 風格中性權重方法,即組合中的股票權重由股票的市值和股票所屬風格在指數(shù)中所占的權重決定。
實際上,采用風格分位+市值加權,與采用普通分位+風格中性權重, 當指數(shù)權重與市值權重一致時,兩種方法都能達到同樣的風格中性效果。
(4) 殘余收益率方法,對風格影響的剔除,除了從上述標準化、分位數(shù)和權重三個角度考慮外,最后一個方法就是直接從股票收益率中剔除所在風格板塊的收益率。
下圖說明了上述四種處理方式的關系,分位數(shù)、 標準化和殘余收益率三種方法是從影響 IC 角度影響因子的有效性,而權重是從收益率角度影響因子的有效性。
.png)
.jpg)




