金程問(wèn)答這里模型為什么要進(jìn)行一階差分?不是只研究公司3的股價(jià)嗎?這樣應(yīng)該是不涉及油價(jià)的時(shí)間序列吧
第五題的答案里說(shuō),設(shè)H0=0,HA不等于0,不等號(hào)的話應(yīng)該是雙尾檢驗(yàn),但答案里為什么說(shuō)是One-tail test呢
best fit看BIC指標(biāo),怎么理解best fit,是說(shuō)模型更簡(jiǎn)潔的意思么?(AIC是預(yù)測(cè)能力)
如何判斷是正的序列相關(guān)還是負(fù)的?通過(guò)什么指標(biāo)?
這道題中說(shuō)LASSO 可以用于邏輯回歸,但是課上說(shuō)這是對(duì)于連續(xù)Y的, 但是學(xué)習(xí)邏輯回歸的時(shí)候說(shuō)有個(gè)threshold level, 高于是1,低于是0,所以只要有threshold,就可用于分類(lèi)Y?
老師11題在EDA過(guò)程中,在特征選擇時(shí) ,是不是應(yīng)該關(guān)注high chi-square和high mutual information values?
LR test是在考綱嗎
log likelihood statistics這個(gè)在考綱里面嗎,怎么沒(méi)找到,麻煩問(wèn)一下,謝謝
第五題為什么不能先算出logodds的差值,因?yàn)槠渌疾蛔?,只有這兩個(gè)變量變化了,是能算出一個(gè)logodds的變化量的,繼而算出概率的變化量。前面一題算變動(dòng)1單位的自變量,logodds變動(dòng)多少,繼而算出概率不也是這么算的嗎
第七題法選擇是ML 模型訓(xùn)練的首要任務(wù),受以下因素控制:(1) 有監(jiān)督或無(wú)監(jiān)督學(xué)習(xí),(2) 數(shù)據(jù)類(lèi)型,以及 (3) 數(shù)據(jù)大小。陳述1里少了一點(diǎn),考試的時(shí)候算對(duì)還算錯(cuò)呢?
是不是只能在句子級(jí)別的TF乘以IDF來(lái)計(jì)算TF-IDF。在這種相乘的指標(biāo)情況下,DF只能用句子級(jí)別的
解答視頻中14分鐘的時(shí)候說(shuō)DF是站在單個(gè)文件的角度去計(jì)算的,那TF也必須統(tǒng)一;然后一開(kāi)始的時(shí)候老師還說(shuō)DF還可以站在文件集的角度計(jì)算,是不是這種情況下,TF跟他統(tǒng)一就可以,也是站在文件及角度
p-value < alpha, 與T.S. > Critical Value,這兩者是等價(jià)的嗎?若不是,請(qǐng)解釋?zhuān)x謝
pseudo R square是什么?課程沒(méi)有講到啊
老師您好,請(qǐng)問(wèn)第三問(wèn) 題目中提到 preparation of the textual data,為什么老師默認(rèn)是cleasing,我理解preparation 包含了cleaning & wrangling,為什么這里wrangling包含的部分就不是題目的答案呢?
程寶問(wèn)答