嚴同學
2025-07-11 09:27model specification error是什么意思?都有哪幾種?為什么ABC都屬于這種錯誤?
所屬:FRM Part II > Operational Risk and Resiliency 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Michael助教
2025-07-12 20:35
該回答已被題主采納
同學你好,model specification error表示的是模型在假設(shè)中的錯誤,這個題目中的B和C比較容易理解,都是假設(shè)(assuming)中的問題,然后A選項其實是遺漏重要變量偏差(也是違背回歸模型假設(shè)的常見情況)。
-
追問
那calibration error除了D選項說的還有什么?可以舉幾個例子嗎?
-
追答
同學你好,首先要說明校準誤差這個并不在考試大綱的學習要求中,因為這個部分涉及到一些機器學習的內(nèi)容,已經(jīng)放在了一級數(shù)量的考試大綱里面了。下面我簡要解釋一下。
首先,校準誤差的本質(zhì)?是模型預(yù)測的概率(如“80%可能性上漲”)與實際發(fā)生的頻率不一致。在D選項里面,模型校準依賴于訓練/驗證數(shù)據(jù)的分布。若數(shù)據(jù)時間段選擇不當(如忽略經(jīng)濟周期、政策變化、突發(fā)事件),會導(dǎo)致數(shù)據(jù)分布失真,也就是樣本無法代表模型應(yīng)用時的真實世界分布(如用牛市數(shù)據(jù)訓練,預(yù)測熊市),以及?概率估計失效?,模型基于歷史錯誤分布預(yù)測的概率,無法反映未來實際發(fā)生頻率。
其次,類似的案例還有很多,我舉一些例子
??(1) 模型結(jié)構(gòu)導(dǎo)致的系統(tǒng)性偏差?
?問題?:模型本身無法捕捉概率的真實分布規(guī)律。比如神經(jīng)網(wǎng)絡(luò)模型因過度簡化或過擬合,傾向于輸出接近0或1的極端概率(也就是非黑即白),導(dǎo)致過度自信。
???(2) 類別不平衡(Class Imbalance),這個也是出現(xiàn)最多的??
?問題?:訓練數(shù)據(jù)中少數(shù)類樣本過少,模型對少數(shù)類預(yù)測概率失真。
(3) 未校正的模型輸出?
?問題?:分類模型(如決策樹、SVM)的原始輸出并非真實概率,直接使用會導(dǎo)致誤差。
(4)數(shù)據(jù)污染?
?問題?:驗證/測試數(shù)據(jù)被泄露到訓練中,或與訓練數(shù)據(jù)重疊。最常見的就是使用“未來數(shù)據(jù)”,如在時間序列預(yù)測中,用“未來數(shù)據(jù)”驗證模型,導(dǎo)致模型在測試集過度自信。
