1個回答
Michael助教
2019-05-03 22:53
該回答已被題主采納
學員你好,
1、決策樹屬于將數(shù)據(jù)分類的一種方法。在樣本量比較小的時候,分類的方法可以非常多,并且不同的方法最終形成的結果卻可以相同。
比如一個屋子2個人,一男一女,需要提供方法將男女區(qū)分開來,你可以按照年齡、身高、體重、星座……好多方法都可以做到。但是如果一個屋子100人,50男50女,那么要將男女分開來的話,對應的方法一定會減少,比如不能單純看年齡等等。這就是決策樹要想一個通用的分類方法最好是大樣本數(shù)據(jù)的原因。
2、邏輯回歸的整個模型已經(jīng)建立完畢,只要求解對應的參數(shù)即可。就像正態(tài)分布我只要知道均值和方差就行了,既然找到10個數(shù)可以求出均值和方差,找到100個數(shù)也是求出相同的均值和方差,那么就沒有必要找100個數(shù),邏輯回歸亦是同理。不僅如此,更大的樣本意味著更多的outlier,更多的noise,使得參數(shù)的求解反而誤差更大,所以小樣本更加合適。
-
追問
謝謝您的詳細回答!
