192****4472
2024-08-03 10:13這里的data snooping結(jié)論來(lái)的離譜,文中只是描述根據(jù)數(shù)據(jù)做推斷,沒(méi)說(shuō)反復(fù)跑模型,得到想要的結(jié)果才做推斷呀?根據(jù)數(shù)據(jù)推斷不是很合理的事情嗎。還有testing prior inference是什么意思?它和根據(jù)數(shù)據(jù)做推斷不是一個(gè)意思嗎?
所屬:CFA Level II > Portfolio Management 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
愛(ài)吃草莓的葡萄助教
2024-08-06 11:32
該回答已被題主采納
同學(xué)你好。data snooping是數(shù)據(jù)挖掘。例如給你兩組數(shù)據(jù),可能之間沒(méi)有關(guān)系,可能就有杠精就會(huì)強(qiáng)行在這兩種數(shù)據(jù)中找關(guān)系,這就是數(shù)據(jù)挖掘,強(qiáng)行找關(guān)系。
信息中說(shuō)了,在得到統(tǒng)計(jì)結(jié)果后進(jìn)行推斷分析,這潛在的存在數(shù)據(jù)挖掘偏差。你會(huì)從得到的結(jié)果中找出各種各樣的關(guān)系,但是你找的關(guān)系有多少是有意義的,這是不是在挖掘數(shù)據(jù)。
-
追問(wèn)
我沒(méi)有從題目中理解到老師說(shuō)的解釋。Make an inference after looking at statistical results理解起來(lái)是正常的數(shù)據(jù)分析的流程,比如說(shuō):給一段時(shí)間的股市做了回歸,從統(tǒng)計(jì)學(xué)角度看哪些factors contributed to growth/loss,這很正常呀,怎么看出來(lái)他有強(qiáng)行解釋不一定存在的東西呢?
老師沒(méi)回答Testing a prior inference是什么意思,這和上面的行為有什么區(qū)別嗎? -
追答
同學(xué)你好。給出統(tǒng)計(jì)結(jié)果再進(jìn)行推斷分析,可能存在強(qiáng)行找關(guān)系,即過(guò)度數(shù)據(jù)挖掘。例如公司業(yè)績(jī)好,你會(huì)認(rèn)為是產(chǎn)品質(zhì)量好得到消費(fèi)者認(rèn)可等,也會(huì)認(rèn)為與老板學(xué)歷、老板性別等有關(guān)使得公司業(yè)績(jī)好。你總是能夠找出各種各樣理由來(lái)解釋公司業(yè)績(jī)好,這就是數(shù)據(jù)挖掘,給你一個(gè)數(shù)據(jù),你拼命的從中挖掘各種信息,這些信息其中一大半可能都是沒(méi)有顯著性影響的,是不是可能存在過(guò)度挖掘數(shù)據(jù)的現(xiàn)象。
在事前可以進(jìn)行各種推斷,然后進(jìn)行統(tǒng)計(jì)分析,對(duì)之前的推斷進(jìn)行判斷,這就是后面(testing~)說(shuō)的意思。 -
追問(wèn)
那么此處正確的做法應(yīng)該是什么呢?
-
追答
同學(xué)你好。通常是先做推斷,然后在進(jìn)行檢驗(yàn)。如果先進(jìn)行分析得到結(jié)果,然后再進(jìn)行推斷的話,容易在已經(jīng)得到的統(tǒng)計(jì)結(jié)果中強(qiáng)行找聯(lián)系。
-
追問(wèn)
原來(lái)是這樣,是不是類似假設(shè)檢驗(yàn),第一步一定要先做假設(shè)的意思?然后想問(wèn)一下,那么如果是見(jiàn)到“先進(jìn)行分析得到結(jié)果,然后再進(jìn)行推斷”這樣的表述,一定是錯(cuò)誤的,有data snooping的問(wèn)題的嗎?還是有特例?
-
追答
同學(xué)你好。首先具體問(wèn)題具體分析,如果是給到結(jié)果再進(jìn)行推斷分析,極有可能出現(xiàn)數(shù)據(jù)挖掘問(wèn)題。其次不是非對(duì)即錯(cuò)的概念,這是兩種分析方法,偏差也不是錯(cuò)的概念。行為金融學(xué)中有很多行為偏差,人就都是錯(cuò)的嗎,顯然不對(duì)。有偏差我們可以認(rèn)識(shí)它并且克服或者改變它,避免沒(méi)有考慮或者陷入偏差中。
