李同學(xué)
2020-08-07 21:58為什么ESS的自由度為k,RSS的自由度為n-k-1?異常值的檢測(cè),用cook's distance,分子的含義是什么?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
Jenny助教
2020-08-10 11:11
該回答已被題主采納
同學(xué)你好,對(duì)于RSS來說,因?yàn)閗+1個(gè)回歸系數(shù)可以僅由k+1個(gè) y與x的關(guān)系式 聯(lián)立方程求得,所以占用k+1個(gè)自由度(更準(zhǔn)確的說是帶來k+1個(gè)自由度限制)。剩下的殘差自由度就是n-k-1。換句話說,當(dāng)知道了k+1個(gè)最小二乘回歸系數(shù),n個(gè)y中知道了任意n-k-1個(gè)y,剩下的k+1個(gè)y可以計(jì)算出來。而ESS為回歸平方和,即擬合值與均值之差的平方和,那么知道擬合值需要知道k+1個(gè)系數(shù)就ok了,但是均值占用了一個(gè)自由度,所有能夠自由取值的變量個(gè)數(shù)就只有k個(gè)。
cook's distance 用于診斷各種回歸分析中是否存在異常數(shù)據(jù)。如果某一條數(shù)據(jù)記錄被排除在外,那么由此造成的回歸系數(shù)變化有多大。顯然,如果這個(gè)值過大,那么就表明這條數(shù)據(jù)對(duì)回歸系數(shù)的計(jì)算產(chǎn)生了明顯的影響,這條數(shù)據(jù)就是異常數(shù)據(jù),需要好好考量是否在你的模型中使用這條數(shù)據(jù)。
