周同學(xué)
2021-03-11 09:32老師,seasonalities中啞變量那個地方為什么去掉截距項就可以是四個啞變量呢?L4不是還可以=1-L1-L2-L3嗎。
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Jenny助教
2021-03-11 14:34
該回答已被題主采納
同學(xué)你好,這部分的解釋會有點超綱,簡單了解即可。這個實際上是算法上面的問題。會涉及到矩陣和線性代數(shù)方面的內(nèi)容,所以大概了解一下就可以了。
主要是記結(jié)論,即如果有截距項的情況下,只能引入m-1個虛擬變量,否則會導(dǎo)致虛擬變量陷阱。
假設(shè)y是因變量,自變量有C1、C2、C3。在有截距項b時,回歸模型為:
y=a1×C1+a2×C2+a3×C3+b
按上圖中的虛擬變量設(shè)置,用OLS(ordinary least squares)求解方程的時候,模型解為
[a1,a2,a3,b]’=invert((X’X))X’Y,
當(dāng)有截距項b的并用時候,用上述公式求解模型就會遇到“虛擬變量陷阱”,也就是矩陣X’X是不可逆的(因為矩陣并不是滿秩的)。簡單來說就是完全多重共線性(即其中一個自變量可以完全由另外兩個自變量決定)導(dǎo)致OLS算法中矩陣不可逆。從而無法計算回歸模型的系數(shù)(“虛擬變量陷阱”是和回歸模型的求解算法有關(guān)的,上述的OLS的閉式解會報錯)。
如果去掉截距項,這個矩陣是滿秩的,也就是各列向量并不是線性相關(guān)。故此時,沒有共線性的問題,那么就可以計算出回歸模型的系數(shù)。所以在沒有截距項的情況下,是可以有4個虛擬變量的,不會造成虛擬變量陷阱的問題。
