Paddy
2020-09-23 21:3928題 請問下 out of sample 是指樣本以外的數(shù)據(jù) 怎么感覺A B C都可以呢 都有樣本以外的數(shù)據(jù)的意思
所屬:CFA Level I > Financial Reporting and Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Irene助教
2020-09-24 11:15
該回答已被題主采納
同學(xué)你好
不是的哦。這里問的是,以下哪一類偏差可以用樣本外數(shù)據(jù)監(jiān)測?就是說:用了樣本外數(shù)據(jù),可以反饋出這類偏差。
這個問題主要出現(xiàn)在data-mining bias里面,就是說因為反復(fù)使用同一組數(shù)據(jù)庫建模和測試,會導(dǎo)致對樣本內(nèi)數(shù)據(jù)模擬得非常好,但是因為建模時過度關(guān)注樣本內(nèi)數(shù)據(jù)的偶然因素,如果換一組樣本外數(shù)據(jù),這些偶然因素就不存在了,會導(dǎo)致樣本外數(shù)據(jù)估計不準(zhǔn)確。所以這個就是data mining bias的定義:把偶然當(dāng)必然。這個bias可以用樣本外數(shù)據(jù)監(jiān)測,只要發(fā)現(xiàn):用樣本外數(shù)據(jù)測試模型,模型估計的準(zhǔn)確度會大幅降低,這個就知道是data mining bias。
A說的是look-ahead bias是說用還未公開的數(shù)據(jù)建模,和樣本外數(shù)據(jù)無關(guān)。
C說的是樣本選擇偏差,就是說人為剔除一些取不到的數(shù)據(jù)。
這兩個問題,都不能用樣本外數(shù)據(jù)直接監(jiān)測出來。所以不選。
