134****4518
2023-12-05 19:08這里都已經(jīng)設定y=1了,為什么分母仍然使用y的普通表達式?為什么這里不直接把y替換成1?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
黃石助教
2023-12-06 10:15
該回答已被題主采納
同學你好。建議同學對邏輯回歸的設定稍作了解即可,不必深究,掌握公式與含義就夠了。
邏輯回歸(包括與其并列的probit model)都是基于潛在變量法(latent variable approach)推導出來的。簡單來說,潛在變量法是假設有一個我們觀測不到的潛在變量Y*,Y* = a + b*X1 + c*X2 + ...,但是當Y*超過某個閾值時,我們可以觀測到現(xiàn)實中的變量Y = 1,當Y*低于某個閾值時,我們可以觀測到現(xiàn)實中的變量Y = 0(舉例:當財務困境嚴重到一定程度時企業(yè)選擇違約,Y = 1,當財務困境并沒有嚴重到一定程度時企業(yè)不違約,Y = 0,這里財務困境嚴重程度就是Y*,我們并不能直接觀測到這么一個變量)。注意此時E[Y] = Pr(違約)*1 + Pr(不違約)*0 = Pr(違約),也就是說E[Y]就是違約的概率(更廣義地,是Y = 1的概率)。聯(lián)系到回歸就是本質(zhì)上就是一個條件期望(條件于自變量、對于因變量的期望),因此一個簡單粗暴的辦法就是直接將Y對X做回歸,Y = a + b*X1 + c*X2 + ...。這種方法也被稱作linear probability model。該方法有一個致命缺陷,就是通過線性回歸預測得到的Y可能大于1也可能小于0,不符合E[Y|X]是條件概率的特性。所以我們這時引入一個分布的CDF來限制Y的取值范圍嚴格處于0和1之間(這里的CDF在學術(shù)上被稱作link function),也就是Y = F(a + b*X1 + c*X2 + ...)。邏輯回歸就是用了一個邏輯分布CDF,probit model則是使用標準正態(tài)CDF。
-
追問
老師回復的內(nèi)容沒看懂,有再簡單一些的解答嗎?
-
追問
我是不是可以這樣理解,我通過公式計算出來一個y的值,假如說是0.89。但是我認為當這個概率超過0.8時,這個事情就應該判斷為發(fā)生,所以此時計算出來的結(jié)果>0.8,我就認為y發(fā)生,也就是y=1。
-
追答
同學你好。從計量經(jīng)濟學的角度,在FRM一級的內(nèi)容中同學掌握下圖即可。FRM原版書中對邏輯回歸的介紹較為簡略,很多細節(jié)都沒有提到,所以直接看邏輯回歸的公式會有些不好理解的。在機器學習中,邏輯回歸一般被用于處理二分類的問題,一類標簽為0,一類標簽為1。一般做法是,如果邏輯回歸的函數(shù)值大于0.5,那就判定屬于1,否則屬于0。實際應用中也要視情況而定,同學這里的理解是正確的。
