1個回答
黃石助教
2024-03-19 11:33
該回答已被題主采納
同學你好。這里課上授課老師就是舉個例子。實證研究中,我們可以通過將數(shù)據(jù)可視化來觀察是否可能存在outlier,比如我觀察到存在這樣一個點A,看起來非常像outlier。接下來,我就可以使用比如像Cook distance這樣的指標來去核實。假如說計算得到的Cook distance > 1,那么我們就認為A點應該是一個outlier。而關于A點具體要不要放在回歸當中作為數(shù)據(jù)去使用,這又是另一個問題了。比如如果你認為這種數(shù)據(jù)以后不會再發(fā)生,或者是由與研究課題無關的特殊現(xiàn)象導致的,那么就不要將其包含在數(shù)據(jù)集中;但如果你認為這種數(shù)據(jù)也是真實發(fā)生過的事件,我們的模型理應考慮到這種事件的影響,那你也可以把它保留在數(shù)據(jù)集中。實操中通常是包含outlier的數(shù)據(jù)集跑一個回歸,不包含outlier的數(shù)據(jù)集再跑一個回歸,然后同時匯報。
