瓦同學(xué)
2021-05-03 10:14講義中bagging的解釋是a model is run thousands of times,each on a different subsample of the dataset,average all the runs.看意思是模型一樣,訓(xùn)練數(shù)據(jù)不一樣,然后結(jié)果平均。怎么老師講的是模型不一樣然后求平均?
所屬:FRM Part II > Current Issues in Financial Markets 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Michael助教
2021-05-06 19:04
該回答已被題主采納
學(xué)員你好,非常抱歉給你產(chǎn)生了學(xué)習(xí)的困擾。
bagging指的是一種模型(比如說回歸),然后利用不同的樣本數(shù)據(jù),擬合出同一種類型但是不同的模型,接著利用這些模型進行預(yù)測得到了多個預(yù)測值,最后將這些預(yù)測值進行平均。
舉一個簡單的例子,小張想利用下個月的收入數(shù)據(jù)預(yù)測自己下一個月的支出情況,已知小張有大量歷史的收入和支出的數(shù)據(jù),并且小張下個月的收入預(yù)計為20000。下面用bagging的方法進行機器學(xué)習(xí)。
第一步,小張定下自己會使用一元線性回歸的方法,結(jié)合bagging進行預(yù)測;
第二步,由于有大量的歷史數(shù)據(jù),小張在大量數(shù)據(jù)中隨機選擇50個數(shù)據(jù),利用這50個數(shù)據(jù),得到了收入和支出的關(guān)系為:y=a1*X+b1
第三步,帶入20000的收入情況,小張找到了第一個預(yù)測支出值,假設(shè)為y1
第四步,重復(fù)第二步到第三步的情況,產(chǎn)生多個不同的回歸模型(但是不管參數(shù)怎么變,都是回歸模型),找出多個預(yù)測值y1,y2……
第五步,將所有的預(yù)測值求平均,得到最終預(yù)測結(jié)果
所以,關(guān)鍵詞是,一種類型的模型,但是有多個模型預(yù)測不同的結(jié)果(主要的原因是樣本數(shù)據(jù)不一樣),最后求平均。
希望對你有幫助。
