YW
2023-12-01 08:06老師例子里:node 算出來的消費的平均值 意義是什么呢? 如果最終terminal node的還是每個數(shù)據(jù)自己的消費值, 那第一次分類的平均值21000 列出來的感覺毫無意義
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2023-12-01 13:48
該回答已被題主采納
同學你好。在CART(Classification and Regression Trees)模型中,如果是回歸問題,CART模型在每個葉節(jié)點計算的是目標變量的平均值(期望值),這是因為在訓練過程中,模型會試圖找到一個決策邊界,使得目標值在每個葉節(jié)點上的平均值最小。換句話說,CART模型是通過最小化每個葉節(jié)點上的目標值方差來逼近真實函數(shù),這就有點像在線性回歸中學到的OLS回歸思想。
此外,使用平均值作為每個葉節(jié)點的預測也是一種簡化處理,這樣做可以避免模型在處理復雜數(shù)據(jù)時過度擬合。通過使用平均值,CART模型可以構(gòu)造一個更簡單、更魯棒的模型。
當然,這并不是說CART模型只能使用平均值作為每個葉節(jié)點的預測。在某些情況下,其他類型的預測指標(例如中位數(shù)等)可能更適合回歸問題。然而,平均值是最常見和最直觀的選擇,因為它可以提供一個全局的、平均的觀點,而不會過度關(guān)注任何特定的數(shù)據(jù)點。
