阿同學(xué)
2022-12-16 11:01cluster和stratified的區(qū)別;bootstrap和jackknife的區(qū)別
所屬:CFA Level I > Quantitative Methods 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
Evian, CFA助教
2022-12-22 12:08
該回答已被題主采納
ヾ(?°?°?)??你好同學(xué),
這兩種抽樣方法有什么相同之處?
1
這兩種抽樣方法都是對(duì)總體進(jìn)行分組。
2
這兩種采樣方法都使用了簡(jiǎn)單隨機(jī)抽樣的概念。
這兩種抽樣方法有什么不同?
1
分層隨機(jī)樣本每階層的屬性一致(同一年級(jí),不能代表總體),聚類(lèi)抽樣每隔聚類(lèi)集合屬性不一致(四個(gè)年級(jí)都有,可以代表總體)。
2
對(duì)于分層抽樣,從每階層中抽取一定數(shù)量樣本,從而匯總得到總樣本。對(duì)于聚類(lèi)抽樣,隨機(jī)抽幾個(gè)聚類(lèi)集合。
詳細(xì)舉例:
分層隨機(jī)抽樣
例如,假設(shè)我們想了解復(fù)旦大學(xué)的學(xué)生是否支持新建停車(chē)場(chǎng)。可能存在的問(wèn)題的新生的支持程度將不同于高年級(jí)的學(xué)生。在這種情況下,我們希望獲得樣本數(shù)據(jù)(假設(shè)n=100)涵蓋所有大學(xué)四個(gè)年級(jí)。分層隨機(jī)樣本的步驟如下:
1
以學(xué)校所有復(fù)旦學(xué)生為總體,按年級(jí)將他們分成不同的subpopulation(階層)。在每個(gè)階層中,學(xué)生都是相似的屬性(同一年級(jí))。
2
每個(gè)階層隨機(jī)抽25名學(xué)生,一共100名學(xué)生。
聚類(lèi)抽樣
分層隨機(jī)抽樣在學(xué)校里尋找100名不同的學(xué)生可能相當(dāng)耗時(shí)。于是我們可以使用集群抽樣。在聚類(lèi)抽樣時(shí),需要保證每個(gè)集群都能很好地代表總體,這一點(diǎn)很重要。在復(fù)旦學(xué)校中,這意味著每個(gè)cluster聚類(lèi)集合必須良好代表性總體(四個(gè)年級(jí)全部學(xué)生),我們可以找(home room,類(lèi)似大學(xué)宿舍,不是按年級(jí)和專(zhuān)業(yè)分,而是隨機(jī)入住的大學(xué)宿舍),在每個(gè)home room都會(huì)有四個(gè)年級(jí)的學(xué)生。以下是集群示例的步驟:
1
以復(fù)旦大學(xué)所有學(xué)生作為總體,按home room將總體分成聚類(lèi)集合。在每個(gè)聚類(lèi)集合中,學(xué)生都是不同的(多個(gè)年級(jí))。
2
隨機(jī)取3個(gè)聚類(lèi)集合作為樣本數(shù)據(jù)。
參考信息:
https://www.statsmedic.com/post/stratified-random-sample-vs-cluster-sample
----------------------
學(xué)而時(shí)習(xí)之,不亦說(shuō)乎??【點(diǎn)贊】鼓勵(lì)自己更加優(yōu)秀,您的聲音是我們前進(jìn)的源動(dòng)力,祝您生活與學(xué)習(xí)愉快!~
-
追答
ヾ(?°?°?)??你好同學(xué),
重抽樣的前提是樣本容量較少的情況下,需要產(chǎn)生較多樣本數(shù)量,去對(duì)總體進(jìn)行估計(jì)。
重抽樣resampling有兩種方法:
1.Jackknife
2.Bootstrapping
Jackknife的優(yōu)點(diǎn)及缺點(diǎn):計(jì)算量小,方便,但是重抽樣之后的數(shù)據(jù)之間差異極小
Bootstrapping優(yōu)點(diǎn)及缺點(diǎn):重抽樣之后的數(shù)據(jù)之間差異較大,認(rèn)為可以設(shè)定重抽樣后的數(shù)據(jù)個(gè)數(shù),但是計(jì)算量較大
Jackknife 和Bootstrapl 的區(qū)別:
1.Jackknife方法只能產(chǎn)生了n個(gè)復(fù)制(有n個(gè)樣本容量,那么重抽樣產(chǎn)生的數(shù)據(jù)就是每次切掉一個(gè),結(jié)果有n個(gè)新數(shù)據(jù)集),而B(niǎo)ootstrap 方法可產(chǎn)生B個(gè)重抽樣復(fù)制,且B可以認(rèn)為任意定B的大小
2.當(dāng)n較小時(shí),能更容易(更快)計(jì)算n個(gè)Jackknifef的重抽樣數(shù)據(jù)
3.與Bootstrap 相比,Jackknifel 只利用了更少的信息(更少的樣本)。
4.Jackknifef 產(chǎn)生的數(shù)據(jù)之間的差異很小,每?jī)蓚€(gè)Jackknifel 重抽樣樣本中只有兩個(gè)單個(gè)觀測(cè)值不同
----------------------
學(xué)而時(shí)習(xí)之,不亦說(shuō)乎??【點(diǎn)贊】鼓勵(lì)自己更加優(yōu)秀,您的聲音是我們前進(jìn)的源動(dòng)力,祝您生活與學(xué)習(xí)愉快!~
