蛋同學(xué)
2024-09-07 13:28這里priori和pre-pruning區(qū)別是啥
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2024-09-09 14:26
該回答已被題主采納
同學(xué)你好。這兩個(gè)東西本質(zhì)上都是stopping rules specified priori,課件上pre-pruning排錯(cuò)了,造成的不便還請(qǐng)諒解。Stopping rules specified priori就是事前設(shè)定的一系列規(guī)則、以使得決策樹不要變的太復(fù)雜。常見的stopping rules有:1. 二叉樹有多少branches,也就是課件上stopping rules specified a priori下面這里。比方說我設(shè)最多3個(gè)branches,這樣決策樹就不會(huì)持續(xù)不斷‘開枝散葉’。2. 對(duì)節(jié)點(diǎn)上訓(xùn)練集的最小容量進(jìn)行約束,也就是課件上的pre-pruning這里。這個(gè)指的是在某個(gè)節(jié)點(diǎn)上,訓(xùn)練集容量必須高于某個(gè)值,否則就直接出結(jié)論。比如說我要去對(duì)違約/不違約進(jìn)行分類,我同時(shí)要求每個(gè)節(jié)點(diǎn)上至少有100個(gè)觀測(cè)值。假設(shè)我現(xiàn)在通過FICO > XXX,Income > XXX后發(fā)現(xiàn)滿足這兩個(gè)條件的公司只有不到100家,那么決策樹就到此為止,直接出違約或者不違約的概率。3. 約束features的個(gè)數(shù),等等。具體現(xiàn)實(shí)中使用哪種方法就要具體情況具體分析了。
