Silvia
2021-03-10 11:13老師,重大遺漏變量如果和其他變量無(wú)關(guān)系,為什么是模型的錯(cuò)誤,這個(gè)錯(cuò)誤和多重貢獻(xiàn)性剔除的邏輯能再講講嗎
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
Jenny助教
2021-03-10 15:03
該回答已被題主采納
同學(xué)你好,對(duì)于一個(gè)回歸模型,最理想的情況莫過(guò)于:
模型包含了可以解釋因變量的所有自變量,同時(shí)剔除了所有不能解釋因變量的自變量。但是,基本上所有的模型都無(wú)法達(dá)到這個(gè)條件,他們之中,要么(1)剔除了應(yīng)該包含的自變量,要么,(2)包含了不該包含的自變量。如果是剔除了應(yīng)該包含的變量, 這種現(xiàn)象稱(chēng)之為遺漏變量,這個(gè)才是模型風(fēng)險(xiǎn)呀,而不是和其他變量無(wú)關(guān)才叫做模型風(fēng)險(xiǎn)。遺漏變量之所以會(huì)造成最小二乘法產(chǎn)生偏差是因?yàn)楸唤忉屪兞恐性緫?yīng)該由遺漏變量所解釋的部分并沒(méi)有得到充分的解釋?zhuān)潜黄渌慕忉屪兞克忉屃?,這樣就會(huì)造成其他解釋變量的斜率( 回歸) 系數(shù)產(chǎn)生誤差,從而造成了對(duì)于不同的解釋變量Xi,模型的誤差也不盡相同,這違反了多元線性回歸模型中所有的自變量Xi 都不能與殘差項(xiàng)存在相關(guān)性,即Cov(Xi ,εi)的前提假設(shè)。
多重共線性在模型里還是比較常見(jiàn)的,一般來(lái)說(shuō)對(duì)于模型不會(huì)造成太大問(wèn)題,只有存在完全共線性的時(shí)候才需要剔除部分變量,因?yàn)椴惶蕹脑?,無(wú)法得出模型參數(shù)(這個(gè)是算法層面的問(wèn)題,簡(jiǎn)單知道結(jié)論即可)。
-
追問(wèn)
多重貢獻(xiàn)性高F低T,那既然所有變量一起顯著,每一個(gè)單獨(dú)的自變量剔除后都不顯著,所以做模型的人才要一個(gè)個(gè)剔除,再重新做回歸,這樣就可能有重大遺漏變量了嗎
-
追問(wèn)
還有就是違反自變量不能和殘差有關(guān)系,但是剔除重大遺漏變量后,這個(gè)解釋的部分就會(huì)被其他自變量解釋?zhuān)窃斐傻恼`差就是其他自變量的系數(shù)誤差,為什么還會(huì)違反殘差和被剔除的自變量的不相關(guān)性呀
-
追答
1. 在做回歸模型的時(shí)候,本身也是要在遺漏變量和多重共線性之間做取舍的呀。多重共線性本來(lái)就是普遍存在的,所以,加入遺漏的相關(guān)的變量,可能會(huì)出現(xiàn)多重共線性,但一般不會(huì)線性相關(guān)(完全線性相關(guān))。如果多重共線性太嚴(yán)重,可能就可以考慮換個(gè)指標(biāo)。反過(guò)來(lái),如果線性模型對(duì)于現(xiàn)實(shí)數(shù)據(jù)解釋力度已經(jīng)足夠好,那么某一程度也是可以忽略遺漏變量的。
考試只要知道二者概念是什么就可以啦。
2. 不是誤差項(xiàng)和被剔除的變量之間的相關(guān)性,而是誤差和模型中還剩下的xi之間的相關(guān)性,你可以理解為被剔除的變量部分跑到了誤差項(xiàng)里去,而被剔除的部分又和模型里剩下的變量相關(guān),所以誤差和模型里剩下的變量也就相關(guān)了。
