圓同學(xué)
2020-01-13 12:45講義206頁(yè),非參數(shù)檢驗(yàn)的3種情況中,第1是不滿足分布假設(shè),這為什么要使用非參數(shù)檢驗(yàn)?zāi)???第2種,排序了,為什么不能檢驗(yàn)參數(shù)了呢??從1排到20,也可以檢驗(yàn)其均值方差嘛,為什么是非參數(shù)檢驗(yàn)?zāi)???/h3>
所屬:CFA Level I
視頻位置
相關(guān)試題
來源:
視頻位置
相關(guān)試題
1個(gè)回答
Evian, CFA助教
2020-01-13 17:37
該回答已被題主采納
袁同學(xué)你好,
1.參數(shù)檢驗(yàn)中的第一點(diǎn),不滿足分布假設(shè)的檢驗(yàn),需要用到非參數(shù)檢驗(yàn),例如,服從正態(tài)分布的數(shù)據(jù),可以用均值和方差就確定其特征,我們也可以用標(biāo)準(zhǔn)化過程對(duì)數(shù)據(jù)處理,依據(jù)標(biāo)準(zhǔn)正態(tài)分布表來確定critical value。但是,對(duì)于數(shù)據(jù)不滿足正態(tài)分布等可以數(shù)值表示特征的額分布類型,就需要用到非參數(shù)檢驗(yàn)。
2.排序問題,例如第一名美國(guó)GDP=20億,第二名中國(guó)15億,第三名日本9億,這兩組數(shù)據(jù),1/2/3名,和20/15/9,并不是一個(gè)線性關(guān)系,第一二三名只是一個(gè)排序,并不能作為GDP研究中的一個(gè)自變量,這時(shí)會(huì)用到非參數(shù)檢驗(yàn)來分析。
-
追問
講義的意思是:排序好的數(shù)字,得使用nonparametric test。
比如一組數(shù)字:1 2 3 4 5.....50,50個(gè)連續(xù)的整數(shù),均值25.5,方差A(yù),完全可以使用parametric test,為什么不能呢??
這個(gè)不就可以使用parametric test嘛??為什么不能?? -
追答
講義上是data are given in rank,不是numbers are given in rank。
例如,一二三名表示的是排序位置,并不是123的數(shù)值的意思。例如第一名王同學(xué),第二名李同學(xué),第三名夏同學(xué),此時(shí)的數(shù)據(jù)是三位同學(xué)和彼此之間的順序,不是參數(shù)檢驗(yàn)可以使用的。 -
追問
你舉的這個(gè)例子是指的第三種非參數(shù)的情形,即本身就不是參數(shù)問題,因?yàn)橥跬瑢W(xué)李同學(xué)不是參數(shù),而他們的考試成績(jī)排名是個(gè)排序,也是可以使用參數(shù)檢驗(yàn)的,為什么不能呢??
-
追答
參數(shù)檢驗(yàn)是在總體分布形式已知的情況下,對(duì)總體分布的參數(shù)如均值、方差等進(jìn)行推斷的方法。
但是,在數(shù)據(jù)分析過程中,由于種種原因,人們往往無法對(duì)總體分布形態(tài)作簡(jiǎn)單假定,此時(shí)參數(shù)檢驗(yàn)的方法就不再適用了。非參數(shù)檢驗(yàn)正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷的方法。由于非參數(shù)檢驗(yàn)方法在推斷過程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗(yàn)。
如下圖所示例子,是檢驗(yàn)10個(gè)公司sharp ratio和expense ratio排序后,X和Y是排序值,我們不知道這些排序值的分布特征,也就是均值和方差這類數(shù)據(jù),若要研究這兩個(gè)排序值的相關(guān)關(guān)系,此時(shí)用到的是非參數(shù)檢驗(yàn)。 -
追問
仍然沒弄明白。排序的數(shù)據(jù),為什么不能使用參數(shù)分布呢??
1-1億,中間的1億個(gè)整數(shù)自然數(shù)排了序,為什么不能使用參數(shù)測(cè)試了??
請(qǐng)直接回答本例本問題 -
追答
好的
如果這個(gè)1億個(gè)數(shù)據(jù)(用A組數(shù)據(jù)表示),A與B組數(shù)據(jù)(Sharp ratio和expense ratio)相關(guān)聯(lián),則可以做假設(shè)檢驗(yàn)。
此時(shí)研究的是,不滿足參數(shù)檢驗(yàn)分布的數(shù)據(jù),不滿足就不能用參數(shù)檢驗(yàn),例如,從市場(chǎng)上隨機(jī)找到一億家公司,分別獲取兩組數(shù)據(jù),這一億家公司的Sharp ratio和expense ratio,此時(shí)按照大小對(duì)這兩組數(shù)據(jù)排序,排序值從1到1億,此時(shí)研究的數(shù)據(jù)為這兩組排序值(Sharp ratio和expense ratio,用X和Y表示),想研究X和Y這兩組數(shù)據(jù)的相關(guān)關(guān)系r(一家公司可能sharp ratio的排序靠前,而expense ratio排序很后),此時(shí)誰(shuí)知道r服從什么分布,可以直接判斷它服正太分布么?不能呀。所以這些正態(tài)分布的特征量(例如均值方差等)不能使用的,此時(shí)需要用到非參數(shù)檢驗(yàn)。
