老師在另一題講mutual information的時候,還有這題講df的時候都說的是,出現(xiàn)頻次越低越重要,但是在這題的第一題又說了出現(xiàn)頻次最高和最低的都是廢詞。請問怎么區(qū)分這兩種情況?
按照老師給的公式?SST/(n-1)不就應(yīng)該是variance么?在ANOVA表格里面的話,MSS of Total是不是就是variance???
老師好,請問有沒有可能回歸的擬合效果都很好,但是發(fā)現(xiàn)所有斜率都不顯著?或者說,擬合效果和斜率的顯著性之間有很強的正相關(guān)性么
請問Q2,能否直接根據(jù)兩個模型的log likelihood的值來判斷該選擇哪一個模型?即是否選擇原假設(shè)模型(intercept- only model)
請問Q1,雖然adjusted R2 減小,但是SSE也減小了的。增加的變量使SSE減小,不能說明解釋力度增強了嗎?
這里寫的是對raw text data進行preprocess,但是后面實際上是開始清洗,所以是prepare和preprocess吧,因為清洗不屬于preprocess,還是說考試中并沒有完全區(qū)分這兩個詞呢
老師說0.144最小所以拿它來做判斷依據(jù),那如果算出來是在0.5-1之間(比如0/75)、或是大于1這兩種情況分別取多少作為判斷依據(jù)?
這里老師說的什么斜率變小、標(biāo)準(zhǔn)誤變小沒懂麻煩具體解釋一下。標(biāo)準(zhǔn)誤和MSE的區(qū)別在哪里? 還有課上講過RMSE是針對樣本外的,那MSE就是RMSE的平方吧 是樣本內(nèi)還是樣本外呢?
不理解為什么第二問要帶入57而不是5。
在serial correlation中,為什么有l(wèi)agged value的情況下,殘差與自變量相關(guān),進而導(dǎo)致inconsistent estimators?
沖刺筆記上 P42, in-sample error 老師說用SEE來判斷,out-of-sample error 用RMSE來算,這兩個不都是root MSE嗎?老師講的很簡單,一級內(nèi)容我也忘了,二級怎么考?這個知識點講了些啥?
這里提到異方差的情況下MSE增大,標(biāo)準(zhǔn)誤是減小的??墒窃趶娀嗟囊曨l里,老師在介紹用t-test檢驗異方差的時候說:MSE增大,標(biāo)準(zhǔn)誤增大,TS減小,易取偽,所以二類錯誤增加。同樣是MSE變大,一個地方說標(biāo)準(zhǔn)誤減小,一個說增大??梢越忉屢幌聠??
這邊b1,b0以及l(fā)ag1234的t-statistic是跟哪個關(guān)鍵值比較,+-1.65嗎?為什么表2里是遠大,表一里是小于1.65。
為什么第一組近似于隨機猜測?
怎么判斷是不是面板數(shù)據(jù)?面板數(shù)據(jù)和橫截面數(shù)據(jù)的定義和判斷各自是什么?
程寶問答