孫同學(xué)
2021-02-18 12:14老師好,對于回歸檢驗有兩個問題: 1、這個圖片中的M-fold方法每聽懂操作步驟,如果有n個數(shù)據(jù),是將其分為m(3)組嗎?然后是將其中兩組怎么樣和第三組比較嗎?還有為什么是AB兩組一組數(shù)據(jù)做橫坐標(biāo),一組數(shù)據(jù)做縱坐標(biāo)呢?不是一組數(shù)據(jù)就包括對應(yīng)的(x,y)嗎?沒懂,麻煩老師再解釋一下M-fold方法 2、診斷說如果X包括一些無用變量,即x太多,那么bias小,為什么estimation error會變大呢?什么是estimation error?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Jenny助教
2021-02-18 17:36
該回答已被題主采納
同學(xué)你好,
1. 對于每一個模型,M 折交叉驗法都會經(jīng)歷如下的步驟:
首先初始采樣分割成M 個子樣本,一個單獨的子樣本被保留作為驗證模型的數(shù)據(jù),其他M-1 個樣本用來訓(xùn)練計算模型的參數(shù)。
每一次驗證結(jié)束之后,都會對模型進(jìn)行評價,并計算殘差平方和。在交叉驗證重復(fù)M 次后,由于每個子樣本作為驗證集都驗證了一次,我們便可獲得
M 次模型的總殘差平方和。
對于一個模型的M 折交叉驗法就結(jié)束了,接下去就是對剩下的2k -1 個不同自變量組合的模型逐一進(jìn)行M 折交叉驗法,每一個過程都會進(jìn)行M 次交叉
驗證并計算總殘差平方和。
最終,總殘差平方和最小的模型會被選定為最優(yōu)模型。
2. 如果變量太多,那么模型就可能會過于復(fù)雜,在對系數(shù)進(jìn)行估計的時候產(chǎn)生誤差的可能是就會變大,也就是estimation error。
