摘要
量化投資丨Newey-West 調(diào)整是計(jì)量經(jīng)濟(jì)學(xué)中的經(jīng)典方法,在多因子模型回歸分析中無處不在。本文介紹它的用法。
1、引言
本文有很多數(shù)學(xué)公式。
本文的推導(dǎo)重點(diǎn)參考了 William Greene 的經(jīng)典教材 Econometric Analysis(Greene 2003,我用的第五版,最新的出到了第八版)。
本文回答了一個(gè)曾讓我糾結(jié)很久的問題。
在學(xué)術(shù)界關(guān)于 empirical asset pricing 的論文中,portfolio test 和 regression test 是檢驗(yàn)一個(gè)新因子是否有效的兩個(gè)常見手段。在前者中,使用已有因子的收益率作為 regressors、使用基于新因子構(gòu)建的投資組合的收益率作為被解釋變量,進(jìn)行時(shí)序回歸,從而檢驗(yàn)新因子組合是否可以獲得超額收益 α、以及它在已有因子上的 β。在后者中,新因子和已有因子一起被用來和個(gè)股收益率進(jìn)行截面回歸(通常使用 Fama-MacBeth regression),然后考察新因子的預(yù)期收益率 E[f] 是否顯著不為零。
無論是上面哪種方法,學(xué)者們都會(huì)對回歸分析得到的 α、β 以及 E[f] 給出 t-statistic 從而檢驗(yàn)它們的顯著性。而在學(xué)術(shù)論文所報(bào)告的結(jié)果中,經(jīng)常出現(xiàn)諸如“Newey and West adjusted t-statistic”或者“Newey and West adjusted standard error”(standard error 是用來計(jì)算 t-statistic 的)這樣的描述。這不禁讓人疑問:回歸檢驗(yàn)中的 Newey and West 調(diào)整到底是什么?
除了要搞懂它到底是什么之外,我們也關(guān)心它是如何實(shí)操的,這樣才能將它用在 A 股的實(shí)證研究中。這就是本文關(guān)心的話題。本文的內(nèi)容提要如下:
第二、三節(jié)介紹必要的數(shù)學(xué)背景,解釋 Newey-West 調(diào)整的重要性。
第四節(jié)針對 A 股進(jìn)行 portfolio test 的實(shí)證研究,指出考慮 Newey-West 調(diào)整后 α 和 β 的顯著性的變化。
第五節(jié)說明通過 Fama-MacBeth regression 求解因子預(yù)期收益率 E[f] 中的 Newey-West 調(diào)整是一種簡化版。
第六節(jié)總結(jié)本文,并評論一下 Barra 在計(jì)算協(xié)方差矩陣中的 Newey-West 調(diào)整。
讓我們從廣義線性回歸說起。
2、廣義線性回歸
考慮如下廣義線性回歸模型(generalized linear regression model):

上述模型是時(shí)序上的線性回歸模型;其中 y 是 T × 1 階向量(T 代表時(shí)序的總期數(shù));X 是 T × K 階矩矩陣(其中 K 是 regressors 的個(gè)數(shù));ε 是 T × 1 階殘差向量;Σ(T × T 階)是殘差的協(xié)方差矩陣?;貧w的目的是為了得到回歸系數(shù) β(K × 1 階矩陣)并檢驗(yàn)它們的顯著性。
上述模型和經(jīng)典線性回歸模型最大的區(qū)別是矩陣 Ω 的引入。在經(jīng)典模型中假設(shè)給定解釋變量 X 下,不同時(shí)刻 t 的殘差是獨(dú)立且同方差,因此 Ω 是單位陣 I。
在廣義線性回歸中,殘差獨(dú)立、同方差這兩個(gè)假設(shè)均可被打破,從而得到兩個(gè)殘差中常見的特性:異方差(heteroscedasticity)和自相關(guān)(autocorrelation)。多因子模型回歸中的殘差就經(jīng)常呈現(xiàn)上述兩種特性。在廣義線性回歸模型中引入 Ω 正是為了反映上述特性。以下是兩個(gè)例子。
對于異方差(但仍可以假設(shè)獨(dú)立),通常有:

對于自相關(guān)(但同方差),通常有:

當(dāng)然我們也可以既考慮異方差又考慮自相關(guān)性。在一般情況下 Ω矩陣中第 i 行、第 j 列的元素用 ω_{ij} 表示。
如果 Ω 已知,則通常使用 generalized least squares 來對 β進(jìn)行參數(shù)估計(jì)。但當(dāng) Ω 未知時(shí),OLS 往往是首選。對該廣義線性回歸模型進(jìn)行 OLS 求解就可以得到 β 的 OLS 估計(jì),記為b:

對上式兩邊取期望,則當(dāng) E[ε|X] = 0 的假設(shè)成立時(shí)易知 E[b] =β。利用 E[b] = β 進(jìn)而推導(dǎo)出 b 的協(xié)方差矩陣,記為 V_OLS:

當(dāng)殘差不存在異方差以及自相關(guān)性時(shí),Ω = I 而上面的協(xié)方差矩陣也可以簡化成我們最熟悉的經(jīng)典 OLS 里面的形式,也就是各種 OLS 軟件包給出的參數(shù)的標(biāo)準(zhǔn)誤(協(xié)方差矩陣對角線元素的平方根)和 t-statistic 的結(jié)果。然而,當(dāng)殘差存在異方差或者自相關(guān)時(shí),OLS 得到的 β 的方差的估計(jì)是不準(zhǔn)確的,從而影響對 β 進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
在 Ω 未知的情況下,需對 V_OLS 進(jìn)行估計(jì)。上面的表達(dá)式可以看成是三個(gè)矩陣相乘的形式,其中第一個(gè)和第三個(gè)僅和 X 有關(guān),因此核心目標(biāo)就是估計(jì)中間矩陣(middle matrix)。為了方便討論,另 Q 代表中間的矩陣:

其中 x_i = [x_{i1}, x_{i2}, …, x_{iK}]’,即 X 的第 i 行的轉(zhuǎn)置(注意它不等于 X 的第 i 列)。一旦我們能找到矩陣 Q 的估計(jì),便可進(jìn)而求出 b 的協(xié)方差矩陣 V_OLS。在估計(jì) Q 時(shí),我們需要用到的“武器”便是 regressor 矩陣 X 以及回歸殘差 e。
針對殘差的假設(shè)不同,最常見的兩種估計(jì)是 White 估計(jì)(僅假設(shè)異方差)以及 Newey and West 估計(jì)(考慮異方差及自相關(guān))。
3、White and Newey-West Estimators
當(dāng)殘差僅有異方差但沒有自相關(guān)時(shí),我們需要的估計(jì)量 Q 簡化為:

White (1980) 指出使用 X 以及 e 可以求出 Q 的漸進(jìn)估計(jì)(記為 S_0):

將上述 Q 的估計(jì) S_0 代入到 V_OLS 的表達(dá)式中,可以得到 b的協(xié)方差矩陣的估計(jì):

上述估計(jì)稱為 White heteroscedasticity consistent estimator。這一結(jié)果極其重要。它意味著哪怕我們對異方差的取值或結(jié)構(gòu)一無所知,我們?nèi)匀豢梢愿鶕?jù)最小二乘的結(jié)果進(jìn)行適當(dāng)?shù)耐茢唷?紤]到實(shí)際問題中,多因子收益率殘差的異方差性質(zhì)未知,這一性質(zhì)就顯得格外重要。
在實(shí)際問題中,除了異方差外,仍需考慮殘差的自相關(guān)性。為此,一個(gè)自然的想法是將上述 Q 的估計(jì)延伸到對角線之外的元素,即:

然而,這種方法有兩個(gè)問題,因此并不正確:
1. 首先,該表達(dá)式中一共有 T^2 項(xiàng)求和,而它的 scaling factor 僅僅是 1/T,因此 S 可能完全不收斂;
2. 即便 S 收斂,它也很可能不是正定的,從而使得最后估計(jì)的 b 的協(xié)方差矩陣不是正定的,這顯然有違常理。
怎么辦呢?大名鼎鼎的 Newey and West estimator(Newey and West 1987)閃亮登場!他們給出了當(dāng)殘差同時(shí)存在異方差和自相關(guān)時(shí),Q 的相合估計(jì),記為 S:

這就是計(jì)量經(jīng)濟(jì)學(xué)中無處不在的 Newey-West 調(diào)整。上式中,大括號中的第一項(xiàng)對應(yīng)僅有異方差情況下的 S_0,而后面第二項(xiàng)則是針對自相關(guān)性的修正。其中 L 是計(jì)算自相關(guān)性影響的最大滯后階數(shù)(Newey and West 1994 給出了自動(dòng)計(jì)算 L 取值的自適應(yīng)算法),w_l 是滯后期 l 的系數(shù),其隱含的意思是自相關(guān)性的影響隨著滯后期 l 的增大而減小。在實(shí)際計(jì)算時(shí),考慮到自由度的問題,為了得到無偏估計(jì)可以將上式中大括號外面的 1/T 換成 1/(T - K);大括號內(nèi)部的求和項(xiàng)仍是 T 項(xiàng)及 L × T 項(xiàng)。
將 S 代入到 V_OLS 的表達(dá)式中,得到 Newey–West autocorrelation consistent covariance estimator:

在時(shí)序 OLS 回歸中,Newey-West 調(diào)整同時(shí)作用于多個(gè)regressors 的回歸系數(shù),從而求出 b 的協(xié)方差矩陣,常見于因子分析中的 portfolio test 中,具體方法為:
1. 使用目標(biāo)因子投資組合的收益率序列和(多個(gè))已有因子收益率在時(shí)序上 OLS 回歸(同時(shí)帶截距項(xiàng),代表超額收益部分;假設(shè)已有因子 + 截距項(xiàng)一共 K 個(gè) regressors),得到殘差;
2. 使用截距項(xiàng)和已有因子收益率序列(回歸中的 X)和殘差 e,通過 Newey-West 調(diào)整求出 V_OLS;
3. 將 V_OLS 的對角線元素開平方,其平方根就是參數(shù) b的標(biāo)準(zhǔn)誤(一共 K 個(gè),對應(yīng) K 個(gè) regressors);
4. 使用 b 的估計(jì)和 Newey-West 調(diào)整后的標(biāo)準(zhǔn)誤計(jì)算出這些參數(shù)的 t-statistics,從而判斷它們的顯著性。
下面來看一個(gè)例子。
4、一個(gè)例子
對于使用“預(yù)期差”因子構(gòu)建的投資組合,該文應(yīng)用一些已有因子進(jìn)行了 portfolio test。假設(shè)已有因子包括 Fama and French (1993) 三因子以及 Carhart (1997) 的動(dòng)量因子。這四個(gè)因子的累積收益率如下圖所示。下面用這個(gè) portfolio test 說明 Newey-West 調(diào)整。

以上述四個(gè)因子以及一個(gè)截距項(xiàng)作為 regressors,對“預(yù)期差”因子的投資組合在時(shí)序上進(jìn)行 OLS 回歸,得到殘差 e。加入截距項(xiàng)后,X 矩陣一共有 5 列 —— 第一列全是 1,對應(yīng)截距;后面四列對應(yīng) 4 個(gè)已有因子的收益率時(shí)間序列。使用 X 和 e 對進(jìn)行 Newey-West 調(diào)整,計(jì)算回歸系數(shù)的標(biāo)準(zhǔn)誤。在計(jì)算中,使用 Newey and West (1994) 自動(dòng)計(jì)算滯后階數(shù) L:

由于實(shí)證中一共使用了 108 期月頻收益率數(shù)據(jù),因此 T = 108;由上式計(jì)算出的 L = 4。下表給出了使用經(jīng)典 OLS 和使用 Newey-West 調(diào)整后得到的回歸系數(shù) standard errors 以及 t-statistics。

使用 Newey-West 調(diào)整后,“預(yù)期差”選股的超額收益(α)的 t-statistic 從 3.325 上升至 4.371;HML 以及 MOM 因子的系數(shù) β_HML 和 β_MOM 的 t-statistics 分別從 20.171 和 3.420 降低到 10.778 和 2.233。
5、簡化版調(diào)整
上一節(jié)說明了在進(jìn)行時(shí)序回歸的 portfolio test 中如何進(jìn)行 Newey-West 調(diào)整。那么,使用截面回歸的 regression test 又如何呢?
在因子分析中,F(xiàn)ama-MacBeth regression 是最常見的截面回歸方法(Fama and MacBeth 1973)。在該回歸中,每一期使用當(dāng)期因子暴露和個(gè)股下一期的收益率進(jìn)行截面回歸,得到因子的收益率;在全部期進(jìn)行截面回歸后,便可得到每個(gè)因子收益率的時(shí)間序列。將因子收益率在時(shí)序上取均值就得到每個(gè)因子的預(yù)期收益率,而我們關(guān)心的是該因子預(yù)期收益率是否顯著不為零。
對于任何因子,其收益率序列在時(shí)序上很可能存在異方差和自相關(guān)性,因此在計(jì)算其均值標(biāo)準(zhǔn)誤的時(shí)候需要進(jìn)行 Newey-West 調(diào)整。然而,這和上面的多因子時(shí)序回歸很不相同。如何進(jìn)行 Newey-West 調(diào)整呢?
關(guān)于這個(gè)問題,Turan Bali、Robert Engle、Scott Murray 三位所著的經(jīng)典教材 Empirical Asset Pricing, the cross section of stock returns(Bali et al. 2016)給出了答案。對于單個(gè)因子的收益率序列,將其用 1 作為 regressor 回歸得到殘差 —— 這相當(dāng)于用因子收益率減去它在時(shí)序上的均值。然后把這個(gè)殘差和 X = 1 代入到 Newey-West 調(diào)整中即可。

在這個(gè)簡化版的 Newey-West 調(diào)整中,Q 的估計(jì) S 簡化為:

其中 f_t 代表被檢驗(yàn)因子的收益率時(shí)間序列,E_t[f_t] 是它在時(shí)序的均值。由于我們僅僅有一個(gè) regressor,因此上述 S 其實(shí)是一個(gè)標(biāo)量。將它代入到 V_OLS 的表達(dá)式中,在對其開方,就得到 E_t[f_t] 的標(biāo)準(zhǔn)誤:

對每個(gè)因子依次使用上述修正,獲得其各自收益率均值的 standard error,然后就可以計(jì)算 t-statistic 以及 p-value 并檢驗(yàn)它們的顯著性。
6、結(jié)語
本文介紹了計(jì)量經(jīng)濟(jì)學(xué)中常見的 Newey-West 估計(jì)(順便提一句, White 1980 估計(jì)也十分流行),它們在因子回歸分析中無處不在。在 portfolio test 中,通過時(shí)序回歸,并應(yīng)用 Newey-West 調(diào)整對多個(gè) regressors 的回歸系數(shù)的標(biāo)準(zhǔn)誤同時(shí)修正;在 regression test 中,首先通過 T 期截面回歸得到因子的收益率時(shí)序,然后再對該時(shí)序進(jìn)行 Newey-West 調(diào)整從而得到因子預(yù)期收益率的標(biāo)準(zhǔn)誤。
在 Barra 的因子模型中,采用 Newey-West 調(diào)整對日頻因子收益率的協(xié)方差矩陣進(jìn)行了修正(Briner et al. 2009, pp 25):

有必要指出的是,Barra 修正的是因子收益率的協(xié)方差矩陣,而不是因子收益率均值或者任何回歸系數(shù) β 的協(xié)方差矩陣。仔細(xì)檢查上面的式子,并沒有看到任何 regressor 矩陣 X 或者殘差向量 e 的身影;以上 Barra 的用法和本文討論的 portfolio test 和 regression test 中的 Newey-West 調(diào)整都不太一樣。我對其的理解是(歡迎批評、指正),Barra 借鑒了 Newey-West 在處理 middle matrix Q 時(shí)引入滯后期處理自相關(guān)性的方法,將它的日頻自相關(guān)矩陣 C 對標(biāo)為 Newey and West (1987) 中的 \hat Ω_0,從而應(yīng)用了 Newey and West (1987) 中的式 (5)。
最后,非常感謝你認(rèn)真看到這里。這不是一篇 fancy 的文章,而是一篇工具文,希望它能對你有些幫助。在我自己進(jìn)行 empirical asset pricing 研究時(shí),在 portfolio test 和 regression test 時(shí)也會(huì)用到 Newey-West 調(diào)整。相信你看完本文,在今后再看到我提及它的時(shí)候,知道我干了什么。
參考文獻(xiàn)
Bali, T. G., R. F. Engle, and S. Murray (2016). Empirical asset pricing, the cross section of stock returns. John Wiley & Sons, Inc., Hoboken, New Jersey.
Briner, B. G., R. C. Smith, and P. Ward (2009). The Barra Europe equity model (EUE3). Research Notes.
Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance, Vol. 52(1), 57 – 82.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of
Financial Economics, Vol. 33(1), 3 – 56.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.
Greene, W. H. (2003). Econometric Analysis (5th ed). Prentice Hall, Upper Saddle River, New Jersey.
Newey, W. K. and K. D. West (1987). A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix. Econometrica, Vol. 55(3), 703 – 708.
Newey, W. K. and K. D. West (1994). Automatic lag selection in covariance matrix estimation. Review of Economic Studies, Vol. 61(4), 631 – 653.
White, H. (1980). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica, Vol. 48(4), 817 – 838.
(點(diǎn)擊上圖了解課程詳情)
量化金融分析師(簡稱AQF ,Analyst of Quantitative Finance)由量化金融標(biāo)準(zhǔn)委員會(huì)(Standard Committee of Quantitative Finance,SCQF)主考并頒證,是代表量化金融領(lǐng)域的專業(yè)水平證書。 >>>點(diǎn)擊咨詢AQF證書含金量
.png)
課程適合人群:
金融工程/數(shù)學(xué)專業(yè)背景的同學(xué)/工作人士,希望進(jìn)一步學(xué)習(xí)Python編程以及在量化投資的實(shí)戰(zhàn)應(yīng)用;
非金融工程專業(yè)背景的同學(xué)/工作人士,希望迅速成為寬客;
金融相關(guān)人員,希望學(xué)習(xí)如何系統(tǒng)的做量化策略;
個(gè)人投資者,希望系統(tǒng)學(xué)習(xí)掌握量化投資相關(guān)的實(shí)務(wù)技能,從模型開發(fā),回測,策略改進(jìn),搭建穩(wěn)定的量化交易系統(tǒng)。
量化金融分析師AQF核心課程體系:
1、《量化投資基礎(chǔ)》
主要涵蓋了量化投資領(lǐng)域的必備知識,包括:基本面分析、技術(shù)分析、數(shù)量分析、固定收益、資產(chǎn)組合管理、權(quán)益、另類投資等內(nèi)容。
2、《Python語言編程基礎(chǔ)》
包含了Python環(huán)境搭建、基礎(chǔ)語法、變量類型、基本函數(shù)、基本語句、第三方庫、金融財(cái)務(wù)實(shí)例等內(nèi)容。旨在為金融財(cái)經(jīng)人提供最需要的編程方法。
3、《基于Python的經(jīng)典量化投資策略》
包含了最富盛名,最基本的量化交易思想和交易策略。例如:海龜交易模型、Logistics模型、配對交易模型、波動(dòng)擴(kuò)張模型、Alpha模型、機(jī)器學(xué)習(xí)(隨機(jī)森林模型、主成分分析)、深度學(xué)習(xí)(人工神經(jīng)網(wǎng)絡(luò))等內(nèi)容。
4、《量化交易系統(tǒng)設(shè)計(jì)》
旨在學(xué)習(xí)量化交易系統(tǒng)的具體知識,包括過濾器,進(jìn)入信號,退出信號,倉位管理等詳細(xì)內(nèi)容,并指導(dǎo)學(xué)員設(shè)計(jì)涵蓋個(gè)人交易哲學(xué)的量化交易系統(tǒng)。
5、《量化實(shí)盤交易》
旨在為解決實(shí)際量化交易策略搭建過程中的一些問題提供較優(yōu)解決方案。>>>點(diǎn)擊咨詢AQF課程相關(guān)問題
三、掌握Python及量化投資技能,我們能做什么?
1、熟悉中國主要金融市場及交易產(chǎn)品的交易機(jī)制;
2、熟知國內(nèi)外期貨交易、股市交易的異同點(diǎn)和內(nèi)在運(yùn)行機(jī)制;
3、掌握經(jīng)典量化交易策略細(xì)節(jié)及其背后的交易哲學(xué);
4、掌握金融、編程和建模知識基礎(chǔ),擁有量化交易實(shí)盤操作能力;
5、具備獨(dú)立自主地研發(fā)新量化交易策略的能力;
6、掌握量化交易模型設(shè)計(jì)的基本框架,以及風(fēng)險(xiǎn)管理和資產(chǎn)組合理論的實(shí)際運(yùn)用;
7、掌握從策略思想——策略編寫——策略實(shí)現(xiàn)餓完整量化投資決策過程;具備量化投資實(shí)戰(zhàn)交易能力。
.png)
金程推薦: AQF難考嗎 AQF證書含金量 AQF量化金融分析師年薪
咨詢電話:400-700-9596
AQF考友群:760229148
金融寬客交流群:801860357
微信公眾號:量化金融分析師
作者:石川,量信投資創(chuàng)始合伙人,清華大學(xué)學(xué)士、碩士,麻省理工學(xué)院博士;精通各種概率模型和統(tǒng)計(jì)方法,擅長不確定性隨機(jī)系統(tǒng)的建模及優(yōu)化。知乎專欄:https://zhuanlan.zhihu.com/mitcshi。未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載


.png)


