153****0188
2023-04-25 16:151.有outliers是好的還是壞的?2.outlier和y和其他x有什么關系3.我們是希望在regression中除去異常值outlier的嗎?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
Michael助教
2023-04-25 17:05
該回答已被題主采納
學員你好,從模型建模的角度來說是一個需要去解決的問題,給數(shù)據(jù)處理增加了難度。
outliers的存在會使得模型的估計出現(xiàn)不準,照顧了異常值就忽略了正常值,忽略了異常值就會讓模型有解釋的缺陷。
我們希望合理去除異常值,比如說在比賽中會去掉一個最大值一個最小值,但是不能只去掉最大值。
-
追問
1.outliers和x和y有什么關系呢?有多重共線性嗎?2.需要去除outliers嗎?怎么去除outliers呢?請老師分別1,2回答哈
-
追答
1.utlier指的是x和y之間出現(xiàn)異常關系的數(shù)據(jù)點,異常值可以是x也可以是y。比如研究身高和體重的關系的時候,我們發(fā)現(xiàn)大部分的數(shù)據(jù)都滿足身高越高體重越大,但是有一個數(shù)據(jù)則正好相反(比如身高220cm,體重40kg),這種就是異常值可能是身高220cm,也可能是40kg。
2.是不是去掉outlier需要結合實際情況。如果統(tǒng)計者認為這個數(shù)據(jù)點對分析的意義不大(比如我想研究身高在150-180cm的人的身高和體重的關系),那么就可以去掉這個數(shù)據(jù)點(身高220cm,體重40kg),然后使用其他的數(shù)據(jù)去研究分析即可;但是如果研究者認為這個數(shù)據(jù)對研究有意義,則不可以刪除。
