BOW, n-gram, DTM分別是什么,有哪些特征詞區(qū)分
第一題的文字解析說,要滿足多元回歸假設(shè),自變量不是隨機的,怎么理解?
精 這里為什么只會高估,不會低估呢?
老師,這里只要是隨機游走都是協(xié)方差不平穩(wěn)的,不管是有沒有drift的隨機游走?
老師,這里的第二行,做簡單數(shù)學變換,把Xt-1移到等式左邊,也可以得到Xt-Xt-1=殘差,此時設(shè)Zt=Xt-Xt-1,也可以如圖上所示得到MRL=0,那是不是就是說明這個式子本身就有MRL=0的特性,那也就不需要做一階差分?。浚ㄒ浑A差分是為了把MRL不等于0的式子轉(zhuǎn)換成MRL=0的式子,是這樣嗎?不是請老師指正。)這里做一階差分的意義到底是什么?
老師,請問下如果同方差被違反了,那么殘差散點圖畫出來是什么樣的呢?序列自相關(guān)的情況下和殘差和X線性相關(guān)的情況下,殘差散點圖又是什么樣呢?
為什么第4個會有serial_correlation
老師,請問什么叫overfitting
這里Y*為什么是cap值,不是含有殘值嗎,應該是Y*不帶cap
句子集,和語料庫是一個意思嗎? 計算TFIDF時,為什么TF 與 DF 指標的方向性是相反的呢? 我理解句子集是我們要分析的文本,語料庫是指提前通過科學統(tǒng)計方法,準備的用于文本分析的基礎(chǔ)庫。 請問我的理解錯在哪里呢?
PPT中 Other models for time series data為什么視頻中沒有講
這個方程完整的式子應該是什么呢
講義上說當unequal class distribution時用FI score比用accuracy更合適,unequal class distribution是什么意思?
Q4為啥正的序列自相關(guān),會導致SSE和MSE偏小呢?看沖刺筆記Page 25頁上說正的序列自相關(guān)定義是,一個觀測值的正殘差增加了另一個觀測值的正殘差的機會,從這個定義上說,存在正序列自相關(guān)不就是導致估計出的模型SSE偏大么?
自回歸模型的使用條件是 “歷史的數(shù)據(jù)和未來差不多”,那既然這樣的話,它還有什么使用價值呢?前后都差不多,那為什么還需要預測呢?課程聽到這,我感覺自回歸的應用場景,只限于 “長期圍繞均值上下波動“的變量,對不對,比如利率這種東西,大漲大跌的比如說股票價格就不行?
程寶問答