趙同學(xué)
2023-01-04 13:53data snooping bias老師講的時(shí)候說(shuō)有個(gè)題眼叫“repeatedly searching",重復(fù)研究為什么不算是sample selection bias?
所屬:CFA Level I > Quantitative Methods 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
Evian, CFA助教
2023-01-05 09:48
該回答已被題主采納
ヾ(?°?°?)??你好同學(xué),
Data snooping bias是模型分析數(shù)據(jù)時(shí)出現(xiàn)了過(guò)度擬合或者抓取樣本信息,這個(gè)問(wèn)題和“樣本選擇”沒(méi)有直接關(guān)系(任意樣本喂給模型都有可能發(fā)生dta snooping bias)。
Self-selection bias,樣本選擇偏差。
它指的是基金經(jīng)理在對(duì)外報(bào)告自己業(yè)績(jī)的時(shí)候,可以自我選擇披露的對(duì)象,比如只披露自己手中經(jīng)營(yíng)的明星產(chǎn)品,業(yè)績(jī)一般的就不對(duì)外進(jìn)行公開(kāi)。這種由自我選擇所產(chǎn)生的偏差,被稱為自我選擇偏差。比如對(duì)沖基金的業(yè)績(jī)披露就是如此。
data snooping bias(又稱Data mining bias)
指的是數(shù)據(jù)挖掘偏差,是模型過(guò)度抓取了樣本數(shù)據(jù)的特征,而不能將模型推廣,以便準(zhǔn)確估計(jì)總體特征。
例如,要研究哺乳動(dòng)物。用貓的圖片作為樣本,總體是哺乳動(dòng)物。
模型抓取信息過(guò)度的意思是,模型從貓的圖片中總結(jié)“耳朵在頭上方、爬行、全身有毛發(fā),四肢差不多長(zhǎng)”來(lái)估計(jì)總體,可是我們給電腦模型一張人類的圖片,模型會(huì)說(shuō)人不是哺乳動(dòng)物。
這個(gè)過(guò)程沒(méi)有人為主動(dòng)影響結(jié)果的好壞,發(fā)生偏差的主要原因是模型分析數(shù)據(jù)程度的設(shè)置,或者樣本容量較小。
----------------------
學(xué)而時(shí)習(xí)之,不亦說(shuō)乎??【點(diǎn)贊】鼓勵(lì)自己更加優(yōu)秀,您的聲音是我們前進(jìn)的源動(dòng)力,祝您生活與學(xué)習(xí)愉快!~
