Will
2022-01-31 15:31我想問一下,既然啞變量存在完美線性相關(guān),就違背了多元回歸的ols第六條假設(shè),那我們?yōu)槭裁匆谔幚韝變量時(shí)用到啞變量呢。還是說啞變量處理x只能用在單元里面?在多元里由于有第六條所以不能用了嗎
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
Jenny助教
2022-02-01 13:48
該回答已被題主采納
同學(xué)你好,這就是為什么我們引入啞變量的時(shí)候是m-1個(gè),主要就是為了解決完美線性相關(guān)。比如有4個(gè)季節(jié),那么我們只引入3個(gè)啞變量。對(duì)于季度來說,一年有四個(gè)季度,假如D1表示第一季度,D2表示第二季度,D3表示第三季度,那么D4 就等于1-D1-D2-D3。這和它們的取值是0或1 是不矛盾的,現(xiàn)實(shí)是不可能出現(xiàn)既是第三季度,又是第二季度。比如現(xiàn)在是第二季度,D2=1,其他的變量就是都是0,包括D4. 假設(shè)D4也包含在模型里,那么變量之間就存在完全共線性。去掉一個(gè),就可以解決這個(gè)問題。
-
追問
那什么是啞變量陷阱呢,為什么說啞變量陷阱是完美相關(guān)性呢
-
追答
虛擬變量陷阱是指一般在引入虛擬變量時(shí)要求如果有m個(gè)定性變量,在模型中引入m-1個(gè)虛擬變量。對(duì)于季度來說,一年有四個(gè)季度,假如D1表示第一季度,D2表示第二季度,D3表示第三季度,那么D4 就等于1-D1-D2-D3。這和它們的取值是0或1 是不矛盾的,現(xiàn)實(shí)是不可能出現(xiàn)既是第三季度,又是第二季度。比如現(xiàn)在是第二季度,D2=1,其他的變量就是都是0,包括D4. 假設(shè)D4也包含在模型里,那么變量之間就存在完全共線性。
另外,這里再對(duì)虛擬變量陷阱進(jìn)行展開一下,這部分的解釋會(huì)有些超綱,會(huì)涉及到矩陣和線性代數(shù)方面的內(nèi)容,所以這部分會(huì)簡單略過不展開。大概了解一下就可以了。
主要是記結(jié)論,即如果有截距項(xiàng)的情況下,只能引入m-1個(gè)虛擬變量,否則會(huì)導(dǎo)致虛擬變量陷阱。
假設(shè)y是因變量,自變量有C1、C2、C3。在有截距項(xiàng)b時(shí),回歸模型為:
y=a1×C1+a2×C2+a3×C3+b
按上述的虛擬變量設(shè)置,用OLS(ordinary least squares)求解方程的時(shí)候,模型解為[a1,a2,a3,b]’=invert((X’X))X’Y,
當(dāng)有截距項(xiàng)b的并用時(shí)候,用上述公式求解模型就會(huì)遇到“虛擬變量陷阱”,也就是矩陣X’X是不可逆的(因?yàn)榫仃嚥⒉皇菨M秩的)。簡單來說就是完全多重共線性(即其中一個(gè)自變量可以完全由另外兩個(gè)自變量決定)導(dǎo)致OLS算法中矩陣不可逆。從而無法計(jì)算回歸模型的系數(shù)(“虛擬變量陷阱”是和回歸模型的求解算法有關(guān)的,上述的OLS的閉式解會(huì)報(bào)錯(cuò))。如果去掉截距項(xiàng),這個(gè)矩陣是滿秩的,也就是各列向量并不是線性相關(guān)。故此時(shí),沒有共線性的問題,那么就可以計(jì)算出回歸模型的系數(shù)。
