李同學(xué)
2020-10-15 11:42老師辛苦~ 問(wèn):有一個(gè)說(shuō)法,就是季節(jié)性啞變量,如果方程中,春夏秋冬4個(gè)啞變量都引入,但是春夏秋冬前面的系數(shù)都相同,那么就可以不要啞變量、直接加入一個(gè)常數(shù)截距項(xiàng),我不理解,麻煩老師解釋?
所屬:FRM Part I 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
Jenny助教
2020-10-15 14:38
該回答已被題主采納
同學(xué)你好,完整的說(shuō)法是如果回歸模型中含有截距項(xiàng),若一個(gè)定型變量有m個(gè)類別,則引入m-1個(gè)虛擬變量。如果回歸模型不含截距項(xiàng),則m種特征可以引入m個(gè)虛擬變量。
如果既包含m個(gè)虛擬變量,又有截距項(xiàng)就會(huì)產(chǎn)生虛擬變量陷阱。
這部分的解釋會(huì)有些超綱,會(huì)涉及到矩陣和線性代數(shù)方面的內(nèi)容,所以這部分會(huì)簡(jiǎn)單略過(guò)不展開(kāi)。大概了解一下就可以了。
主要是記結(jié)論,即如果有截距項(xiàng)的情況下,只能引入m-1個(gè)虛擬變量,否則會(huì)導(dǎo)致虛擬變量陷阱。
假設(shè)y是因變量,自變量有C1、C2、C3。在有截距項(xiàng)b時(shí),回歸模型為:
y=a1×C1+a2×C2+a3×C3+b
按上圖中的虛擬變量設(shè)置,用OLS(ordinary least squares)求解方程的時(shí)候,模型解為
[a1,a2,a3,b]’=invert((X’X))X’Y,
當(dāng)有截距項(xiàng)b的并用時(shí)候,用上述公式求解模型就會(huì)遇到“虛擬變量陷阱”,也就是矩陣X’X是不可逆的(因?yàn)榫仃嚥⒉皇菨M秩的)。簡(jiǎn)單來(lái)說(shuō)就是完全多重共線性(即其中一個(gè)自變量可以完全由另外兩個(gè)自變量決定)導(dǎo)致OLS算法中矩陣不可逆。從而無(wú)法計(jì)算回歸模型的系數(shù)(“虛擬變量陷阱”是和回歸模型的求解算法有關(guān)的,上述的OLS的閉式解會(huì)報(bào)錯(cuò))。如果去掉截距項(xiàng),這個(gè)矩陣是滿秩的,也就是各列向量并不是線性相關(guān)。故此時(shí),沒(méi)有共線性的問(wèn)題,那么就可以計(jì)算出回歸模型的系數(shù)。
理論上,去掉截距的話,就可以引入m個(gè)虛擬變量,但是在建立模型的時(shí)候,通常是建立含截距項(xiàng)的模型。雖然不含截距項(xiàng)的模型引進(jìn)和類別相同數(shù)量的虛擬變量不存在完全共線性的問(wèn)題,但要檢驗(yàn)截距項(xiàng)的差值會(huì)更加困難,且不含截距項(xiàng)的回歸在計(jì)算r方上沒(méi)有一個(gè)一致的方法。所以一般都是采用含有截距項(xiàng)的模型進(jìn)行研究。
-
追問(wèn)
不不不,老師,你看圖。
如圖,這道題的C選項(xiàng),答案說(shuō)C是正確的,但是我不理解~ -
追答
同學(xué)你好,如果四個(gè)虛擬變量的系數(shù)都是一致的,那么其實(shí)有有沒(méi)有季節(jié)因素這個(gè)變量就不重要了,因?yàn)椴还苁悄膫€(gè)季節(jié)對(duì)于y的貢獻(xiàn)都是一樣的,都是gamma(不管是gamma幾,反正都是相等的),可以簡(jiǎn)單認(rèn)為是一個(gè)常數(shù)。直接就把它放在截距項(xiàng)里就好了。以上答疑僅供參考,其他機(jī)構(gòu)的出題建議咨詢?cè)摍C(jī)構(gòu)的老師。
