Asher
2021-03-25 17:10一直不明白reading 9 common probability distribution和reading10sampling and estimation中的confidence interval衡量的這個點在區(qū)間內(nèi)的概率 有什么聯(lián)系或者區(qū)別 看著都一樣 只是前者是針對總體 后者是針對樣本 然后都是說這個點在這個區(qū)間內(nèi)的概率 然后reading9是需要standardized變成0,1的標準正太分布才能查表 那reading10為什么又不需要標準化了呢
所屬:CFA Level I > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
Evian, CFA助教
2021-03-25 22:53
該回答已被題主采納
└(^o^)┘同學你好,感謝您耐心的等候!~ 希望以下的解釋可以解決你的困惑:
嗯嗯,了解,舉一個例子,你看過最近的囧媽么?里面有俄羅斯套娃,一個套一個,在一套中,每一個套娃的團圖案是一樣的,但是比例是不一樣的,這樣才能一個套一個,那么工匠師傅制作的時候,要做幾個構圖呢?答案是:1個。為什么呢?因為制作一個三維立體模型構圖后,這個相當于一個標準化的構圖,發(fā)送給全俄羅斯做套娃的廠家,只要更改對應的比例,機器就可以做出不同大小,但是全是一樣的套娃。
在數(shù)學中有一個叫做正態(tài)分布的數(shù)據(jù)呈現(xiàn)方式,同理,不同的情境中,例如身高,收益率,樹木的樹維,這些data數(shù)據(jù)獲取之后,每一組雖然服從正態(tài)分布,但均值和標準差不一樣,怎么辦呢,可以標準化一下嘛,于是有了標準正太分布,其均值為0,方差為1,此時全球各地想研究正態(tài)分布的人就可以通過一張Standard normal distribution表進行查表(區(qū)間和概率一一對應的關系呈現(xiàn))。
Standard normal distribution表進行查表上顯示均值右邊1.965倍標準差對應的左邊的面積是97.5%,如果我獲得了一組1000人中國人的身高樣本(假設服從正態(tài)分布),計算均值(例如170cm)和方差(例如9CM),可以知道均值右邊1.965倍標準差對應的左邊的面積是97.5%,那么大概是1000人中的97.5%的人,他們的身高是在均值170cm+1.965*3cm這個數(shù)值以下的。
以上是正態(tài)分布的標準化↑解釋
以下是置信區(qū)間的解釋↓
對于任意服從正態(tài)分布的數(shù)據(jù)來說,他們構建置信區(qū)間的時候,無需標準化,以均值為中心,k倍標準差為左右長度,此時標準差可以不相同。
為乘風破浪的自己【點贊】讓我們知曉您對答疑服務的支持~
-
追問
明白你說的對于正太分布和標準化的始末 但reading9和10都涉及到了confidence interval 有什么不一樣呢 是不是一個針對一組樣本里的多個樣本 后者針對的是多組樣本里的每組樣本的均值?
-
追問
針對回答中的標準正太分布中的1.965對應的97.5% 這個1.965是k還是標準化以后的z?
-
追問
我還是不明白為什么計算CI之前不需要標準化 那個k倍 1.965倍標準差 不就是標準正太分布表里得來的嗎 而要用那個表的數(shù) 就必須先轉(zhuǎn)換成0,1正太分布不是嗎
-
追答
標準化的最終目的是為了得到概率。
如附圖,已知信息為藍色正態(tài)分布描述的是一個資產(chǎn)收益率,知道均值為10%,標準差為12%,此時我們想知道:有多大的概率收益率會低于3.7%,我們需要得到3.7%這個數(shù)值對應的概率,或者可以理解為藍色分布的面積。
標準化是為了最終可以查表的過程,如紅色標準正態(tài)分布圖,我們計算出的-0.525是標準化后的結果。此時藍紅兩個分布,各自的面積1除以各自總面積,得出的概率是相同的。
接下來是根據(jù)-0.525這個數(shù)字去查表,但是我們的累積概率分布表僅僅顯示0右邊正直,而不是負值,此時有了附圖右下角的轉(zhuǎn)化,我們可以先求0.525這個數(shù)字對應的概率,然后求-0.525這個數(shù)字對應的概率 -
追答
找到累計概率分布表,找到0.52(只能精確到第二位小數(shù),0.52和0.53差不多,我用0.52舉個例子),對應的概率為0.6958,意味著上邊附圖中各自面積2除以各自總面積的比值為69.58%,最后是將1-69.58%=30.42%求出面積1除以總面積的概率。此時可以描述有30.43%的概率,收益率低于3.7%
-
追答
針對回答中的標準正太分布中的1.965對應的97.5% 這個1.965是k還是標準化以后的z?
回復:1.965是關鍵值,是k,reliability factor,在標準正態(tài)分布中,由于標準差為1,這個k值直接可以表示在橫軸上,因為k倍標準差就是k自己。 -
追答
與數(shù)據(jù)是樣本或者總體無關,只要數(shù)據(jù)服從正態(tài)分布,我們就可以用正態(tài)分布的性質(zhì),如下圖表示:
任何服從正態(tài)分布的數(shù)據(jù),知道均值和標準差之后,帶入一下的圖中,置信區(qū)間和概率就是一一對應的關系,沒有標準化的需要,我們可以指定任意k求對應概率。 -
追問
是的老師 第一你回答的是標準化 我明白標準化的目的和過程 我問的是計算CI的時候 它不是k倍標準差嗎 那既然要有k 那必然是在0,1的分布里才能有k 所以這里如果不標準化 那隨便一個正太分布過來 這個k就不能用圖中這些對應的概率了
我現(xiàn)在不是問標準化怎么做 我是想知道 要計算confidence interval 那必然要用k 要用k必然要z table 要z table必然要先標準化 -
追問
這個……你能明白我在問什么嗎
-
追問
老師啊~你說了這么多 我說reading.9和10都涉及confidence interval 還說到為什么ci里需要k卻不需要標準化 但硬是一個問題沒回答呀 你全在說standardization和差z table
-
追答
那既然要有k 那必然是在0,1的分布里才能有k
回復:在正態(tài)分布中,“ k倍的標準差”表示橫軸上某一個點距離均值的一個距離,不是僅僅在標準正態(tài)分布中有。
所以這里如果不標準化 那隨便一個正太分布過來 這個k就不能用圖中這些對應的概率了
回復:為什么不可以。簡單舉例,知道研究的總體數(shù)據(jù)是中國人的身高,它服從正態(tài)分布,總體均值為170厘米,總體標準差為10厘米,此時可以描述均值170厘米左右3倍標準差的這個區(qū)間中,包含了99.99%的數(shù)據(jù),也就是170-3??10=140厘米,170+3??10=200厘米,在140~200厘米之間,包含了99.99%的中國人的身高。
要計算confidence interval 那必然要用k 要用k必然要z table 要z table必然要先標準化
回復:用z標準正態(tài)分布和t學生分布表都可以查k值,不標準化后查,可根據(jù)樣本容量n和顯著性水平確定的。
