1個回答
Michael助教
2021-06-30 23:07
該回答已被題主采納
學員你好,
out of sample指的是不用樣本內的數(shù)據(jù),data ming指的是數(shù)據(jù)挖掘,這個偏誤的直接結果就是將偶然發(fā)現(xiàn)看做一般結論。
主要的原因就是樣本量太小,在小樣本中找到的結論都不具備普世性,所以只要換一個其他的樣本就可以馬上找到反例。
比如看玉林的狗肉節(jié)上大家在吃狗肉就得出結論中國人喜歡吃狗肉,就是一種典型的數(shù)據(jù)挖掘,找一些其他的樣本就可以推翻。
