192****4472
2024-08-03 10:13這里的data snooping結(jié)論來的離譜,文中只是描述根據(jù)數(shù)據(jù)做推斷,沒說反復(fù)跑模型,得到想要的結(jié)果才做推斷呀?根據(jù)數(shù)據(jù)推斷不是很合理的事情嗎。還有testing prior inference是什么意思?它和根據(jù)數(shù)據(jù)做推斷不是一個意思嗎?
所屬:CFA Level II > Portfolio Management 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2024-08-06 11:32
該回答已被題主采納
同學(xué)你好。data snooping是數(shù)據(jù)挖掘。例如給你兩組數(shù)據(jù),可能之間沒有關(guān)系,可能就有杠精就會強(qiáng)行在這兩種數(shù)據(jù)中找關(guān)系,這就是數(shù)據(jù)挖掘,強(qiáng)行找關(guān)系。
信息中說了,在得到統(tǒng)計結(jié)果后進(jìn)行推斷分析,這潛在的存在數(shù)據(jù)挖掘偏差。你會從得到的結(jié)果中找出各種各樣的關(guān)系,但是你找的關(guān)系有多少是有意義的,這是不是在挖掘數(shù)據(jù)。
-
追問
我沒有從題目中理解到老師說的解釋。Make an inference after looking at statistical results理解起來是正常的數(shù)據(jù)分析的流程,比如說:給一段時間的股市做了回歸,從統(tǒng)計學(xué)角度看哪些factors contributed to growth/loss,這很正常呀,怎么看出來他有強(qiáng)行解釋不一定存在的東西呢?
老師沒回答Testing a prior inference是什么意思,這和上面的行為有什么區(qū)別嗎? -
追答
同學(xué)你好。給出統(tǒng)計結(jié)果再進(jìn)行推斷分析,可能存在強(qiáng)行找關(guān)系,即過度數(shù)據(jù)挖掘。例如公司業(yè)績好,你會認(rèn)為是產(chǎn)品質(zhì)量好得到消費者認(rèn)可等,也會認(rèn)為與老板學(xué)歷、老板性別等有關(guān)使得公司業(yè)績好。你總是能夠找出各種各樣理由來解釋公司業(yè)績好,這就是數(shù)據(jù)挖掘,給你一個數(shù)據(jù),你拼命的從中挖掘各種信息,這些信息其中一大半可能都是沒有顯著性影響的,是不是可能存在過度挖掘數(shù)據(jù)的現(xiàn)象。
在事前可以進(jìn)行各種推斷,然后進(jìn)行統(tǒng)計分析,對之前的推斷進(jìn)行判斷,這就是后面(testing~)說的意思。 -
追問
那么此處正確的做法應(yīng)該是什么呢?
-
追答
同學(xué)你好。通常是先做推斷,然后在進(jìn)行檢驗。如果先進(jìn)行分析得到結(jié)果,然后再進(jìn)行推斷的話,容易在已經(jīng)得到的統(tǒng)計結(jié)果中強(qiáng)行找聯(lián)系。
-
追問
原來是這樣,是不是類似假設(shè)檢驗,第一步一定要先做假設(shè)的意思?然后想問一下,那么如果是見到“先進(jìn)行分析得到結(jié)果,然后再進(jìn)行推斷”這樣的表述,一定是錯誤的,有data snooping的問題的嗎?還是有特例?
-
追答
同學(xué)你好。首先具體問題具體分析,如果是給到結(jié)果再進(jìn)行推斷分析,極有可能出現(xiàn)數(shù)據(jù)挖掘問題。其次不是非對即錯的概念,這是兩種分析方法,偏差也不是錯的概念。行為金融學(xué)中有很多行為偏差,人就都是錯的嗎,顯然不對。有偏差我們可以認(rèn)識它并且克服或者改變它,避免沒有考慮或者陷入偏差中。
