金程問(wèn)答Q9,為什么是slight regularization輕微的正則化?這個(gè)模型不是有overfitting嗎?為什么叫做slight regularization (感覺(jué)big data題目全都是閱讀理解,尤其是同一意思的不同說(shuō)法,不知道怎么解決認(rèn)知盲區(qū)的問(wèn)題)很多題目的說(shuō)法在課堂中并沒(méi)有提及也沒(méi)學(xué)到,但其實(shí)本質(zhì)是理解的,就是選不對(duì)
第5題的漢字解析看不懂:t 統(tǒng)計(jì)量和相關(guān) p 值表明所有變量系數(shù)都不顯著(即與零沒(méi)有顯著差異)。因此,該投資組合中極不可能存在月度季節(jié)性。問(wèn)題1:怎么看出t 統(tǒng)計(jì)量和相關(guān) p 值表明所有變量系數(shù)都不顯著的?問(wèn)題2:與零沒(méi)有顯著差異,就是等于0 ,那就是接受H0,那么就是有季節(jié)周期性。為什么與零沒(méi)有顯著差異最后判斷下來(lái)是不可能存在季節(jié)性呢?問(wèn)題3:與0顯不顯著差異,怎么得出是否存在月度季節(jié)性這個(gè)結(jié)論的?
Q7,bias error和variance error的區(qū)別是什么,怎么區(qū)分呢?這兩個(gè)error都是在調(diào)優(yōu)過(guò)程中使得它們?cè)降驮胶脝幔?
這里的n-gram在text wrangling不是已經(jīng)做過(guò)了么?為何在text exploration 中要再做一次?
請(qǐng)問(wèn)4以上是顯著,1.5以下不顯著是為什么?哪里講過(guò)?怎么得到的?
Precision (P) 中在實(shí)際案例中 什么情況算是positives,比如檢測(cè)汽車零部件是個(gè)合格,到底是合格是positives,還是不合格是positives
精 為何一類錯(cuò)誤和二類錯(cuò)誤的可能性是反向關(guān)系呢?
判斷一個(gè)事件的真?zhèn)问歉鶕?jù)事件事實(shí)判斷,好事是positive,壞事是negative(比如此題違約是negative,不違約是positive),而不是通過(guò)分類(class1是positive,class0為negative)對(duì)嗎?真?zhèn)问录袛噙@里有點(diǎn)混淆
精 請(qǐng)問(wèn)老師,第四題,增加樣本容量為什么可以解決多重共線性的問(wèn)題呢?即使樣本容量增加,相關(guān)的自變量仍舊存在啊。。
inclusive為什么是DWtest???
什么情侶是a random walk with drift.
請(qǐng)問(wèn)這里的step1,如果是supervised,也可用dimension reduction 去削減k ?
精 請(qǐng)問(wèn)第九題詞包BOW和N-gram怎么區(qū)分呢?
regularization 中的,maximum tree depth, maximum number of decision nodes, 可以減少features?
老師,請(qǐng)問(wèn)檢測(cè)共線性的經(jīng)驗(yàn)法,所有的individual coefficients都不顯著且F test顯著,才是存在共線性。如果這里的capex和adv都顯著,F(xiàn)也顯著,得出的結(jié)論也是不存在共線性呢?
程寶問(wèn)答