ChiGe
2023-08-21 13:44data preparation里面,cleaning 步驟的invalidity errors和preprocessing步驟里outlier感覺很像,cleaning里non-uniformity error和preprosessing里的conversion, 及cleaning 里的duplication errors和preprocessing中的filtration都很相似???請解釋
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2023-08-22 11:52
該回答已被題主采納
同學(xué)你好。
無效錯誤是指數(shù)據(jù)超出有意義的范圍,導(dǎo)致數(shù)據(jù)無效;而outlier它是指在有意義的數(shù)據(jù)中存在極端值。
例如銀行對信用卡持有人數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)有個人出生日期是1900.1.1,這個超出了人的預(yù)期壽命范圍,沒有意義。而極值,例如銀行發(fā)現(xiàn)持有人薪水大多在10萬左右,有個人薪水0元,薪水0元肯定有意義,但是與極端偏離。
不一致錯誤是指數(shù)據(jù)與相應(yīng)的數(shù)據(jù)點或現(xiàn)實相沖突;轉(zhuǎn)換是指將數(shù)據(jù)集中的變量轉(zhuǎn)換為適當(dāng)?shù)念愋?,以便進(jìn)一步正確處理和分析它們。
重復(fù)錯誤是指存在重復(fù)觀測的地方;過濾是指識別和過濾項目不需要的數(shù)據(jù)行。
投資更加優(yōu)秀的自己?? ~如果滿意回復(fù)可【采納】,仍有疑問可【追問】,您的聲音是我們前進(jìn)的源動力,祝您生活與學(xué)習(xí)愉快
