秦同學(xué)
2025-10-20 22:28information gain應(yīng)該是with the help of Large cap - without the help of Large Cap嗎?那是不是-0.225? 如何解讀
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2025-10-21 17:44
該回答已被題主采納
同學(xué)你好。information game指的是在考慮了large cap的幫助之后和考慮了large cap的幫助之前,基尼系數(shù)的下降幅度。計(jì)算的話,在這道題里就應(yīng)該是0.48-0.255=0.225。這個(gè)0.225的解讀要追溯到基尼系數(shù)的定義,基尼系數(shù)本身衡量的是系統(tǒng)當(dāng)中的一種不確定性。這個(gè)系數(shù)越大、不確定性就越高(可以通過(guò)一個(gè)例子來(lái)理解:假設(shè)只有兩種可能的結(jié)果,不確定性最大的時(shí)候應(yīng)是這兩種結(jié)果發(fā)生的概率各為0.5的時(shí)候,此時(shí)Gini = 1 - 0.5^2 - 0.5^2 = 0.5;不確定性最小的時(shí)候應(yīng)是這兩種結(jié)果有一種發(fā)生概率為1,也就是有一個(gè)結(jié)果是必然會(huì)發(fā)生的,此時(shí)Gini = 1 - 1^2 - 0^2 = 0)。在這里,考慮了large cap這個(gè)特征之后,不確定性下降了0.225。在構(gòu)建決策樹(shù)時(shí),每個(gè)節(jié)點(diǎn)上選擇的特征應(yīng)是該節(jié)點(diǎn)上令不確定性下降最多的特征,這有助于我們做出決策。還是舉一個(gè)極端的例子,比如說(shuō)只要是large cap就必付股息,反之則必不付股息。此時(shí),Gini = 1 - 1^2 - 0^2 = 0;對(duì)于決策而言,這告訴我們,只要看到large cap就無(wú)腦認(rèn)為該公司是支付股息的就行,所以我們此時(shí)會(huì)最想把該特征放在當(dāng)前的節(jié)點(diǎn)上。
-
追問(wèn)
老師,一定是大-小嗎?因?yàn)檫@里考慮了large cap之前是0.48,而考慮了large cap之后是0.255呀? 為什么還是0.48-0.255呢
-
追答
同學(xué)你好。注意information gain對(duì)應(yīng)著不確定性的下降幅度,所以要用一開(kāi)始的不確定性水平減去考慮某個(gè)特征后的不確定性水平。
