undefinable
2022-11-16 22:53請(qǐng)講下data mining 和misinterpretation
所屬:CFA Level III > Capital Market Expectations 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
Johnny助教
2022-11-17 15:37
該回答已被題主采納
同學(xué)你好。
Data mining是反復(fù)地搜索數(shù)據(jù)集,直至出現(xiàn)顯著的模式。這些數(shù)據(jù)本不存在相關(guān)性或者特定范式,但由于你不停的抽樣或者搜索數(shù)據(jù),就會(huì)偶然間突然出現(xiàn)一些數(shù)據(jù)會(huì)存在特定模式。這就是data mining bias,他并不存在經(jīng)濟(jì)原理也不符合邏輯,僅僅是由于過度搜索數(shù)據(jù)集從而偶然間出現(xiàn)了數(shù)據(jù)上的顯著模式。
Misinterpretation of correlation就比如A和B之間存在高度相關(guān),那么就有四種可能,要么A能預(yù)測(cè)B,要么B能預(yù)測(cè)A,要么有第三個(gè)變量C能同時(shí)預(yù)測(cè)A和B,要么A和B之間的高度相關(guān)僅僅是異常值而已。要是解釋錯(cuò)了其中的高相關(guān)性就是misinterpretation,就比如A和B本身沒有經(jīng)濟(jì)聯(lián)系,只是抽樣抽到了異常值結(jié)果導(dǎo)致數(shù)值上存在相關(guān)度,但你卻說能用A去預(yù)測(cè)B。
