Lord Voldemort
2024-04-19 22:24當(dāng)y=1時(shí),為什么不直接用F(y)=1/(1+e^-1),還要把那一大堆線性回歸給帶進(jìn)去呢?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2024-04-23 15:52
該回答已被題主采納
同學(xué)你好。這個(gè)建議直接記住用法即可,F(xiàn)RM中對(duì)于logistic regression的介紹非常簡(jiǎn)單,沒(méi)有怎么去深入討論。實(shí)際上,logistic regression這樣的回歸是基于一個(gè)Latent variable approach,也就是潛在變量法。b0 + b1X1 + ... + e得到的其實(shí)并不是這里的y(j),而是一個(gè)觀測(cè)不到的變量y*(j),但y*(j)又與y(j)有著很強(qiáng)的聯(lián)系:當(dāng)y*(j)大于某個(gè)閾值時(shí)y(j)就等于1,當(dāng)y*(j)小于某個(gè)閾值時(shí)y(j)就等于0。可以聯(lián)想銀行違約的問(wèn)題,當(dāng)銀行的財(cái)務(wù)狀況達(dá)到一定的程度時(shí)銀行就會(huì)違約,此時(shí)y(j) = 1,而y*(j)就是這個(gè)程度。因此,我們可以將模型寫作:如果y(j) = 1,則b0 + b1X1 + ... + e > 0(這里假設(shè)閾值為0,這樣通常是比較方便的);如果y(j) = 0,則b0 + b1X1 + ... + e < 0。更進(jìn)一步,我們可以得出:如果y(j) = 1,則e > -(b0 + b1X1 + ...);如果y(j) = 0,則e < -(b0 + b1X1 + ...)。而e我們通常可以假設(shè)一個(gè)分布,比如如果我們假設(shè)logistic distribution,那么得到的就是logistic regression。此時(shí)如果我們想計(jì)算Prob(yj = 1),那這個(gè)其實(shí)就等于P(e > -(b0 + b1X1 + ...)),而又由于Logistic distirbution是對(duì)稱的,所以P(e > -(b0 + b1X1 + ...)) = P(e < b0 + b1X1 + ...)。根據(jù)logistic distribution的定義(見下圖),P(e < b0 + b1X1 + ...)就等于課件上的公式。嚴(yán)謹(jǐn)來(lái)說(shuō),這個(gè)概率是一個(gè)條件概率:P(yj = 1|X)
