xx
2022-07-13 09:35sample_selection不也是可以解釋會(huì)有out_of_sample的情況嗎?氣死
所屬:CFA Level I > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
Evian, CFA助教
2022-07-13 12:14
該回答已被題主采納
ヾ(?°?°?)??你好同學(xué),
首先明確,你的理解是有道理的,out of sample test可以檢驗(yàn)所有的模型是否準(zhǔn)確,就是我們拿初始樣本數(shù)據(jù)形成了一個(gè)模型A,然后用樣本外數(shù)據(jù)檢驗(yàn)?zāi)P虯,是否準(zhǔn)確
其次說明,在CFA一級(jí)數(shù)量中,out of sample test是放在data mining bias知識(shí)點(diǎn)。換句話說,CFA知識(shí)體系認(rèn)為本題最優(yōu)選是B。
補(bǔ)充:
1
Data mining bias指的是數(shù)據(jù)挖掘偏差,是模型過度抓取了樣本數(shù)據(jù)的特征,而不能準(zhǔn)確估計(jì)總體特征。
例如,研究哺乳動(dòng)物。
用貓的圖片作為樣本,總體是哺乳動(dòng)物,模型抓取信息過度的意思是:模型從貓的圖片中總結(jié)“耳朵在頭上方、爬行、全身有毛發(fā),四肢差不多長(zhǎng)”來估計(jì)總體。
接下來我們想測(cè)一下,模型準(zhǔn)不準(zhǔn),我們給電腦模型(之前樣本之外的數(shù)據(jù))一張人類的圖片,模型會(huì)說人不是哺乳動(dòng)物,模型判斷有誤,因?yàn)槿耸遣溉閯?dòng)物
2
sample selection bias聯(lián)系最緊密的偏差是survivorship bias,out of sample test可能測(cè)不出來sample selection bias。
例如,市場(chǎng)上存在基金都是存活著的基金,抽樣抽到的樣本也都是活著的基金,掛掉的基金不可以抽取,所以抽樣“樣本外數(shù)據(jù)”無法檢測(cè)樣本選擇偏差。
----------------------
學(xué)而時(shí)習(xí)之,不亦說乎??【點(diǎn)贊】鼓勵(lì)自己更加優(yōu)秀,您的聲音是我們前進(jìn)的源動(dòng)力,祝您生活與學(xué)習(xí)愉快!~
