摘要
市場的非有效性確保因子會持續(xù)有效。因子投資的關鍵在于執(zhí)行時對各種細節(jié)的精確處理。本文探討因子投資實踐中的各種細節(jié)。在這方面,量化投資無疑有著巨大的優(yōu)勢。
引言
前些天,有個小伙伴問了這么一個問題:現在量化選股因子泛濫,大家都用同樣的數據做同樣的測試,最后也得出相似的結論,導致很多策略同質化。這個問題量信怎么看?
今天這篇文章就來回答這個問題。
首先,一個因子能夠掙錢是因為市場在該因子方面存在非有效性。用的人越多,市場在那方面越有效,導致因子的效果越差。但就現階段而言就說市場在哪個因子上已經完全有效為時尚早。事實上,由于 A 股市場中噪聲投資者的高度參與感,市場仍遠不夠有效。
拿我們熟悉的價值投資來說,價值投資有效的直接原因不是相關因子的額外風險溢價補償(事實上,價值投資構建的投資組合風險較市場往往更低),而是由于噪音投資者的存在,這是不會消失的,所以它會持續(xù)有效。
在因子仍將會有效這個大前提下,我想更系統(tǒng)的談談第二個方面:同樣是使用主流的因子(比如價值、動量、質量等),有的人賺錢了,有的人卻沒賺錢。雖然是同質化的策略,但因子在靠譜的基金經理手里能發(fā)揮最大的效果,而在不靠譜的基金經理手里則變得非常平庸。這里面的門道又在哪呢?
答案很簡單:細節(jié)決定成敗。
隨著量化選股的普及,市面上出現了很多優(yōu)秀的回測平臺,能夠快速的測試選股因子是否有效。然而,無論測試再怎么方便快捷,一旦真要實盤時,會有一些不得不面對的問題:每個因子應該選多少股票?不同因子如何取舍?股票之間的倉位如何確定?調倉頻率如何選取?交易時如何降低成本?等等。因子投資的成敗取決于能否很好的應對這些問題。
本文旨探討在因子投資實踐中必須考慮的細節(jié)問題。需要說明的是,這里面的某些問題并沒有標準答案、不同的選擇和投資者的風險偏好有關。
細節(jié)一:選擇合適的代理指標
在確定風格因子后,首先要決定的就是找到合適的代理指標。我們以價值(value)因子為例說明這個問題。
順便提一句,現如今我們提到價值投資的時候,由于巴菲特精神深入人心,往往指的是“好公司”+“便宜”。但是,最初的價值投資就是買便宜的。便宜的定義就是公司每單位市值的基本面價值更高,而不在乎基本面的好壞,這叫做 pure value。
當我們使用價值這個因子來選股時,必須通過具體的指標來對股票的便宜程度排名。這就是選擇因子的代理指標。在衡量便宜方面,有很多常見的 multiples(見下面的小貼士),比如 P/E,P/B,EV/EBIT 等。
在英文的資料中涉及價值因子的指標時,multiple 是個非常常見的詞匯,因此拿出來解釋一下,方便小伙伴們以后閱讀英文文獻。multiple 一詞是倍數的意思,顧名思義,指的是兩個指標相除。按照慣例,一般分子上指標的數值要大于分母上指標的數值。比如市盈率 P/E,它就是每股股價和每股 earnings 的比值,這就是一個 multiple;而 EV(Enterprise Value)和 EBIT(earnings before interest and taxes)的比值也是一個 multiple。
面對同一因子的多個代理指標時,我們可以選擇回測時效果較好的那個,也可以使用多個指標同時選股。單一指標可能由于財報數據的不準確而產生噪聲;使用多個指標可以避免這個問題。從實證來看,選擇多個指標通常能提高該因子的選股效果(但這不是絕對的)。不過,由于同一因子的不同指標之間相關度較高,因此也沒有必要選擇太多的指標。
以中證 500 為例,使用 P/B 和 EV/EBIT 兩個指標作為價值因子選股。簡單回測的效果如下表所示。無論是從策略的風險收益特征,還是因子本身的 IC 和 IR 來看,同時使用兩個因子都優(yōu)于單一因子。

當然,同時使用多個代理指標雖然提高了效果,但我們也會問這里面是否有數據挖掘的成分呢?在這方面,著名的量化投資基金 AQR 告訴我們,使用多個指標并不是一種因子激增(因此沒有數據挖掘問題),而是提高因子健壯性的一種方法,因為無論哪個單一指標都無法完美的代表我們的目標因子。
It is important to note that using multiple measures is not a form of factor proliferation, which can lead to concerns about data mining; instead, using additional measures leads to a more robust version of the ideas behind the factors as there isn’t a single, perfect definition of each style.
這種處理類似于機器學習中的集合學習算法,它和隨機森林以及 AdaBoost 算法比單一的決策樹算法分類效果更好有異曲同工之妙。
細節(jié)二:構建因子投資組合
在使用因子選股、構建投資組合時,因子暴露程度和可投資性是必須考慮的兩個因素,然而高的因子暴露是通過犧牲可投資性得到的,我們必須在二者之間取舍。
可投資性是指投資組合中股票的倉位是否合理,該組合的換手率和交易成本是否實際,進入該組合的股票是否有足夠的流動性、該投資組合能承擔的資金量(即投資組合的容量)是否足夠大等。
下面的金字塔圖描繪了五種構建因子投資組合的方法。自下而上,它們的因子暴露越來越高,而可投資性卻越來越低。

在金字塔底部是市場組合,由所有股票按市值加權構成。我們認為市場組合中因子的暴露為零。往上移動是高容量因子組合 —— 這里的容量是就該組合中股票支撐的資金容量而言。該組合不剔除任何股票,但是它們的權重不再由市值決定,而是由股票在該因子上的暴露決定。較市場組合而言,該組合在目標因子上有更高的暴露。繼續(xù)往上是高暴露組合,它會剔除部分因子暴露度低的個股而集中于剩下那些因子暴露度更高的股票,使得組合的因子暴露度更高,但犧牲了一定的可投資性。這三種組合都是純多頭組合。
最上面兩類指的是 Fama-French 三因子模型中的多空構建方法以及 Barra 的純因子組合,它們更多的都是為了評價因子的效果。這兩種組合都是多空組合,由于做空的限制,它們的可投資性比較差。尤其是 Barra 的純因子組合,它在構建時沒有考慮任何可投資性的限制,但它在風險管理中有著非常重要的作用,在本文的第六節(jié)還會提到它。
在因子投資實務中,通常的做法是根據個股在因子上的排序選出一小部分在該因子上暴露高的個股,構建一個投資組合。這種做法相當于上述金字塔中的高暴露組合法。
在選擇股票時,值得考量的標準除了股票在該因子上的強弱外,還包括股票的市值(只有大市值才能支持大的資金容量)、所屬的行業(yè)等因素(想要盡量分散行業(yè)從而規(guī)避行業(yè)特有的風險),目的是盡量構建一個行業(yè)中性且投資性高的組合。
這種方法簡單、透明、邏輯清晰,然而它不容易控制指數對其他風格因子的暴露。比如我們針對價值因子構建的可投資性高的投資組合難免也會在其他因子上有一定的暴露。如果我們觀察到因子的投資組合表現不佳,這可能不是因為該因子失效造成的,而是由該組合在其他因子上的暴露帶來的。
細節(jié)三:多個因子如何選股?
因子投資中通常使用多個風格因子,而非單一因子。這就引發(fā)了一個問題,多個因子如何選股?這時通常有兩種做法:
1. 每個因子獨立選,然后把選出來的股票放在一起。這個方法稱為 portfolio mix。
2. 使用所有因子給股票打分,每個股票得到一個總分,然后按照總分的高低選擇。該方法稱作 integrated approach。
這兩種方法并無一定誰對誰錯。但它們可能會選出完全不同的結果。
考慮下面這個假想的例子,它使用價值因子和盈利因子選股,股票池中的股票在每個因子上的打分從好到壞被分為 A、B、C、D 四擋。

當我們使用 portfolio mix(單個因子獨立選股)時,對于價值(盈利)因子,會把所有在該因子上得分為 A 的股票選出來然后放在一起。該方法不看每支股票的綜合實力,而更在乎它們是否有“偏科”(在特定因子上暴露高)。按此種方法,我們會選出落入上圖中藍色和黃色格子里的那些股票。
另一方面,當使用 integrated approach(多個因子綜合打分)時,只有股票在這些因子上的表現都不錯時,才會被選入(比如在兩個因子上的得分都不低于 B)。該方法考察的是每支股票的綜合實力,它會懲罰“偏科”選手。使用此方法,我們會選出落入上圖中藍色和紅色格子里的股票。
重申一遍:這兩種方法并無一定誰對誰錯。取舍的角度是到底想通過因子投資實現什么樣的目標,以及策略的收益風險比和交易成本。以價值投資為例,它要求股票既滿足盈利高又要便宜,因此在盈利和價值兩個因子上都要表現突出,這時可以選擇的是 integrated approach。而如果我們的目標并不是傳統(tǒng)的價值投資,而只是希望把投資組合盡可能的暴露在盈利和價值這兩個風格因子之上,那么 portfolio mix 這種方法未嘗不是一個更好的選擇。
在下一節(jié),我們將會談到多個因子的配置問題。風格因子投資的范疇遠遠超過用因子法執(zhí)行價值投資。在風格因子投資領域,有很多優(yōu)秀的因子,對它們的(主動)配置格外重要。
細節(jié)四:因子擇時和因子配置
以中證 500 的成分股為選股池,構建下列五個風格因子的純多頭組合:流動性因子、規(guī)模因子、成長因子、價值因子、反轉因子。這五個投資組合相對中證 500 的超額收益的風險收益特性如下。

除了自身的優(yōu)異表現外,這些因子之間的相關性也很低(下圖):

如同配置股票一樣,配置因子也是量化投資中的一個重要課題。它希望把相關性低的多個因子通過某種方式配置在一起,得到一個收益風險比更優(yōu)的多因子配置組合。
常見因子配置方法包括:簡單多樣化、波動率倒數、跟蹤誤差倒數、風險平價以及趨勢追蹤。它們的業(yè)務含義、實現方法以及相應的數學公式如下表所示。

除了簡單多樣化這種被動的靜態(tài)配置方法外,其他四種配置方法都需要結合投資者的主觀判斷。它們從不同方面考慮因子在過去一段時間的表現,從而判斷因子未來的表現,以此動態(tài)的配置因子在下一個配置周期的權重。
上述五種配置方法的效果如下圖所示??梢钥吹?,被動的簡單多樣化就非常優(yōu)秀。而其他四中主動配置方法并沒有帶來顯著的提高(有兩種方法甚至不如簡單多樣化)。

對于簡單多樣化來說,每個因子的權重為 0.2 恒定。而在按照絕對收益率波動率的倒數以及風險平價這兩種方法下,因子的權重雖然隨著時間的推移略有波動,但是波動幅度非常小,整體效果與簡單多樣化非常接近,因此這兩種方法的配置效果和簡單多樣化接近。
波動率的倒數配置策略與風險平價策略關注的都是因子絕對收益率的波動。反觀跟蹤誤差倒數策略,它考量的是因子相對收益率的相關指標。在構建每個因子的投資組合時,我們在滿足可投資性的前提下盡量的追逐投資組合在目標因子上的暴露;高的因子暴露意味著高的主動管理波動,即較大的跟蹤誤差。較大的跟蹤誤差對因子的配置效果造成了負面的影響。
最后來看看趨勢追蹤法。隨著因子投資越來越流行,投資者在選擇因子時往往看中的是因子最近的表現 —— 選擇那些最近幾年收益率高的因子。對業(yè)績的追逐造成大量資金涌入過去有效的因子,從而大幅提高了該因子的估值。這么做造成了兩個問題:
1. 因子估值提升使得因子收益率被高估,容易使人們對因子的效果產生錯誤的預期。在任何理性投資中,哪怕一個標的再好,我們都不應該不計成本的買入。
2. 歷史數據及經濟規(guī)律表明,估值滿足均值回歸。一旦在過去表現過熱的因子的估值回歸,那么就會大大降低它在未來的收益率。
Arnott et al (2016) 指出因子收益率中包括很大的估值溢價(valuation premium)。他們把由估值上升帶來的因子收益率稱為環(huán)境 α。當剔除了因子估值的變化后,很多因子竟然并不能獲得超額收益。Arnott et al. (2017) 的研究發(fā)現選擇那些估值處于歷史低位的因子(即過去表現的不怎么好的因子)比選擇那些過去一段時間過熱的因子,能夠在未來獲得更高的收益。這解釋了為什么按照趨勢追蹤來配置因子效果并不好。
使用哪個因子是個因子擇時問題;如何將資產分配到不同因子上是個因子配置問題。在實際投資中,任何主觀的擇時、配置方法都會比簡單多樣化這種被動方法帶來更多的主動誤差;這增加了交易難度、并有可能提高換手率、增加交易成本。從這個意義上說,被動的簡單多樣化足夠優(yōu)秀,可以勝任配置多個因子的重任。
細節(jié)五:調倉頻率和交易
在確定了使用的因子和如何根據因子挑選股票之后,緊接著的環(huán)節(jié)就是交易了。交易涉及調倉的頻率以及交易日內買賣如何成交。
在調倉頻率方面,可以采用定期(每隔固定的一段時間)和每日調倉。從大量實證經驗來看,如果把調倉的粒度(周期)定為大于 1 個交易日,即不是每天調倉,那么策略的回測效果受實際的調倉日期影響較大(因為在一些特定的日期能恰好選出一些特別優(yōu)秀的股票,而在其他日期卻沒選出)。這一方面自然說明如此的多因子策略是有問題的(對輸入太敏感),但同時也說明這種較低調倉周期也有自身的問題。
雖然財務因子的變化頻率很低、只有當新的財報被披露時才會更新,但是對于和價格有關的因子,比如價值因子或者規(guī)模因子,由于價格每天都會變化,它們的數值也會頻繁變化。每天刷新因子、重新選股可以保證及時的根據最新因子取值。但是每天都調倉可能造成過高的換手率。下圖為在某個使用因子法執(zhí)行的價值投資策略中,在每天更新因子并調倉的前提下,持股個數和年化換手率的關系??梢钥吹?,當持股個數過少時(≤ 5 支),該策略的換手率非常高。當持股個數在 10 以上時,策略的換手率就比較穩(wěn)定了。

除了換手率之外,每天交易需要交易者承受更大的心理壓力。在當前的 A 股市場,自動化交易的限制還比較大,更多的是靠人來交易。人類的情緒、認知偏差等弱點不可避免的會給策略帶來難以評估的不確定性,尤其是在交易頻率高的時候。華爾街的前輩在談及人對量化投資策略的影響時指出:嚴格由機器執(zhí)行得到的效果是量化策略的上限而非下限,任何人為的干預從長期來看都只能削弱策略的表現。
選股個數太少的另外一個問題是風險無法充分分散。因子投資看中的是一攬子股票在風格因子上的共性。如果僅選擇太少的股票,則和這個初衷背道而馳,而更多的是暴露在這些個股的特異性收益率上。此外,如果個股太少,會導致我們把資金重倉在幾支個股上面。一旦持倉中的個別股票發(fā)生了較大的虧損,這會給交易者造成巨大的心理壓力。
交易中的第二個問題是交易的執(zhí)行,它涉及的是在交易日應該如何交易來減少滑點和交易費用。對因子選股來說,通常的做法是在 T 日收盤后,根據最新的價格和財務數據計算出最新的股票倉單,然后在 T + 1 日擇機交易。那么我們是否應該 T + 1 日開盤交易?收盤交易?或者固定時點(比如上午 10 點)交易?亦或是按照 TWAP(時間平均)交易?一般來說,市場的成交量在交易日內呈現 U 型 —— 在開盤和收盤波動較大,因此滑點較高。
下圖顯示了某個因子選股策略根據 T + 1 日不同價格交易的效果(均假設千一的單邊交易費用)。從收益率和夏普率來看,開盤價效果 > 10 點價格效果 > 中午收盤價效果 > 日均價效果 > 收盤價效果。這說明選出來的股票是有效的,因此越早交易越好。當然,在實際中,由于開盤波動率較高,因此需要考慮額外的滑點造成的沖擊。

細節(jié)六:風險管理
本文討論的最后一個細節(jié)是風險管理。在市場狀態(tài)發(fā)生轉換時會造成風格因子失效。然而,更加困難的是想要判斷出一個因子有效或者失效需要較長的周期。
比如規(guī)模因子在 2016 年之前一直有效(挑小市值),而在 2016 年之后則失效了。但我們之所以說它失效,是因為站在兩年后的 2018 年回顧過去兩年小市值的表現時發(fā)現了基于該因子的策略是持續(xù)下跌的。但顯然在現實中,歷經兩年實打實的虧損(而且還虧的很慘)才得出因子失效的結論是很痛苦的。
前文提到,為了構建具有可投資性高的因子投資組合,該組合一定不可避免的在其他風格因子上有暴露。它們會對最終的選股帶來額外的風險。我們應該定期評測投資組合在不同風格因子上的動態(tài)暴露,進行風險歸因和業(yè)績歸因。
為此,Barra 的純因子模型閃亮登場。純因子模型是從數學角度出發(fā)構建的完美暴露于單一風格因子的投資組合,它雖然幾乎不具備任何可投資性,但是在風險歸因上具有重要作用。將選股投資組合的收益率在時序上用這些純因子組合的收益率進行回歸,就可以分析出選股投資組合的收益和風險成分中由哪些風格因子組成。
對于風險來說,Davis and Menchero (2010) 指出:
σ = Exposure × Volatility × Correlation
它的具體表現為下面這個數學關系:

其中 σ(R) 是選股投資組合收益率的標準差,而等式右側的三要素分別為:
Exposure(暴露):即 x_m,它衡量投資組合對每個風格因子的暴露大小。在風險歸因時,不僅應該考慮我們自己選定的風格因子,還應該考慮其他常見的風格因子,因為選股組合會不可避免的暴露在它們上面。
Volatility(波動性):即 σ(r_m),它代表的是第 m 個風格因子收益率 r_m 的標準差。由于投資組合是暴露在不同的風格因子中,那么風格因子收益率的波動越大,它對投資組合的風險的貢獻程度也越大。
Correlation(相關性):即 ρ(r_m, R),它是風格因子 m 選股投資組合收益率之間的相關系數。這種相關性越高,投資組合收益率受風格因子影響的確定性越顯著。
定期對選股投資組合做風險歸因有助于判斷不理想的選股結果是來自選定的風格因子本身(比如風格切換了,風格因子賺不到錢了),還是因為投資組合暴露在其他的因子上造成的。對于后一種情況,則需要考慮重新構建投資組合從而盡量降低其在不必要因子上的暴露。
結語
本文拋磚引玉,介紹了一些在因子投資實踐中必須要考慮的細節(jié)。不可否認,在大家都沒有獨門數據的今天,因子投資變得越來越同質化。但是,只要市場是非有效的,因子就還會有效,而因子投資的關鍵在于執(zhí)行時對各種細節(jié)的精確處理。在這方面,量化投資無疑有著巨大的優(yōu)勢。
量化投資基金 AQR 針對因子投資中的這些問題也展開過相應的討論,并把通過良好執(zhí)行而真正實現因子投資收益的這個過程稱為“craftsmanship alpha(手藝 alpha)”,意思是只有那些專注于做好每個細節(jié)的優(yōu)秀基金經理才能把因子投資在理論上的超額收益轉換成現實。
雖然在這些細節(jié)中并不總是有一定正確或者錯誤的決策,但靠譜的基金經理應該能夠為自己的選擇辯護并深諳每個決策對于投資收益和風險的影響。在這方面,基于經濟原則和經驗證據的細節(jié)處理決策將在大概率上為因子投資帶來更好的結果。
The devil is in the details.
參考文獻
Arnott, R. D., N. Beck, V. Kalesnik, and J. West (2016). How Can 'Smart Beta' Go Horribly Wrong? SSRN: https://ssrn.com/abstract=3040949.
Arnott, R. D., N. Beck, V. Kalesnik (2017). Forecasting Factor and Smart Beta Returns (Hint: History Is Worse than Useless).SSRN: https://ssrn.com/abstract=3040953.
Davis, B. and J. Menchero (2010). Risk Contribution is Exposure times Volatility times Correlation. Technical Report. MSCI Barra Research.
量化金融分析師(簡稱AQF ,Analyst of Quantitative Finance)由量化金融標準委員會(Standard Committee of Quantitative Finance,SCQF)主考并頒證,是代表量化金融領域的專業(yè)水平證書。 >>>點擊咨詢AQF證書含金量
.png)
課程適合人群:
金融工程/數學專業(yè)背景的同學/工作人士,希望進一步學習Python編程以及在量化投資的實戰(zhàn)應用;
非金融工程專業(yè)背景的同學/工作人士,希望迅速成為寬客;
金融相關人員,希望學習如何系統(tǒng)的做量化策略;
個人投資者,希望系統(tǒng)學習掌握量化投資相關的實務技能,從模型開發(fā),回測,策略改進,搭建穩(wěn)定的量化交易系統(tǒng)。
(點擊上圖了解課程詳情)
量化金融分析師AQF核心課程體系:
1、《量化投資基礎》
主要涵蓋了量化投資領域的必備知識,包括:基本面分析、技術分析、數量分析、固定收益、資產組合管理、權益、另類投資等內容。
2、《Python語言編程基礎》
包含了Python環(huán)境搭建、基礎語法、變量類型、基本函數、基本語句、第三方庫、金融財務實例等內容。旨在為金融財經人提供最需要的編程方法。
3、《基于Python的經典量化投資策略》
包含了最富盛名,最基本的量化交易思想和交易策略。例如:海龜交易模型、Logistics模型、配對交易模型、波動擴張模型、Alpha模型、機器學習(隨機森林模型、主成分分析)、深度學習(人工神經網絡)等內容。
4、《量化交易系統(tǒng)設計》
旨在學習量化交易系統(tǒng)的具體知識,包括過濾器,進入信號,退出信號,倉位管理等詳細內容,并指導學員設計涵蓋個人交易哲學的量化交易系統(tǒng)。
5、《量化實盤交易》
旨在為解決實際量化交易策略搭建過程中的一些問題提供較優(yōu)解決方案。 >>>點擊咨詢AQF相關問題
掌握Python及量化投資技能,我們能做什么?
1、熟悉中國主要金融市場及交易產品的交易機制;
2、熟知國內外期貨交易、股市交易的異同點和內在運行機制;
3、掌握經典量化交易策略細節(jié)及其背后的交易哲學;
4、掌握金融、編程和建模知識基礎,擁有量化交易實盤操作能力;
5、具備獨立自主地研發(fā)新量化交易策略的能力;
6、掌握量化交易模型設計的基本框架,以及風險管理和資產組合理論的實際運用;
7、掌握從策略思想——策略編寫——策略實現餓完整量化投資決策過程;具備量化投資實戰(zhàn)交易能力。
.png)
咨詢電話:400-700-9596
AQF考友群:760229148
金融寬客交流群:801860357
微信公眾號:量化金融分析師
聲明丨作者:石川,量信投資創(chuàng)始合伙人,清華大學學士、碩士,麻省理工學院博士;精通各種概率模型和統(tǒng)計方法,擅長不確定性隨機系統(tǒng)的建模及優(yōu)化。


.png)


