周同學(xué)
2025-02-05 20:48這里書上寫的Yj=1,或是該項(xiàng)目成功,是否應(yīng)該寫成F(y)=1,Yj是橫軸,F(xiàn)(y)才是縱軸
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2025-02-06 11:05
該回答已被題主采納
同學(xué)你好。Logistic regression考慮的是Y為伯努利變量的情景,即Y的取值非0即1。通常稱Y = 1的情況為'success'。比方說(shuō)你可以定義Y = 1為違約、Y = 0為不違約。對(duì)應(yīng)的模型中的X變量就可以是一些能夠衡量信用質(zhì)量的指標(biāo)。
之所以在此情景下使用logistic regression,邏輯如下:若Y的取值非0即1,那么E[Y] = Pr(Y = 1)*1 + Pr(Y = 0)*0 = Pr(Y = 1),而E[Y|X] = Pr(Y = 1|X)。又因?yàn)榛貧w本身就是基于X的取值對(duì)Y做預(yù)期,所以E[Y|X] = a + b1X1 + b2X2 + ... + bmXm。然而,由于E[Y|X]本身就等于一個(gè)概率,其取值是有范圍限定的(0 - 1之間),所以單憑估計(jì)一條回歸線不太好處理這里的問(wèn)題。對(duì)此的解決方案是,在回歸線的基礎(chǔ)上引入一個(gè)取值范圍在0 - 1之間的函數(shù)f,將E[Y|X] = Pr(Y = 1|X)寫作f(a + b1X1 + b2X2 + ... + bmXm),這樣就能解決此處的問(wèn)題。常用的函數(shù)f包括標(biāo)準(zhǔn)正態(tài)分布的CDF(使用該CDF的模型叫做probit regression)與邏輯斯蒂分布的CDF(使用該CDF的模型叫做logistic/logit regression)。課件上的F(y)即邏輯斯蒂分布的CDF。
