為啥通過檢驗
想問個題外話 第一次選的random k會影響后面clustering的結(jié)果么 比如k都是2 但是我選擇不同的兩個random k后clustering的結(jié)果是否會不同
使用time series data會出現(xiàn)序列相關(guān)的問題,為什么在使用AR模型的時候,還要用Y的滯后項來代替X?這樣做豈不是仍然存在序列相關(guān)問題,這里不理解
這里是否可以理解為adjusted R^2 越大模型解釋力度的效果就越好?
多元線性回歸假設(shè)5a中說X 不隨機,殘差隨機 因此X與殘差之間的協(xié)方差=0,那么如果X隨機,殘差隨機,是否也可以推出X與殘差之間的協(xié)方差=0,是否也可以用來檢驗雙方之間的線性關(guān)系?
第二題,老師是不是講錯了,題目中提到了雙尾0.05%,那么是否可以根據(jù)這個使用t-test進行檢驗?
既然t檢驗的ppl都非常高,說明這些亞變量的系數(shù)都等于0。而系數(shù)是12月份與該月月份的差額,既然等于0,說明12月份與該月份是相等的,那不是強相關(guān)性嗎???
自回歸與自相關(guān)的區(qū)別是什么
1.打紅色括號的這段話不理解 2.可以麻煩老師幫我解釋一下一致性consistent的概念嗎,應(yīng)該怎么應(yīng)用,最好可以有例子,麻煩了!
如果是FP,那不是一類錯誤嗎,老師不是說二類錯誤才更嚴重嘛,Miller擔(dān)心的是不是并購對象,但被認為是,那應(yīng)該是二類錯誤才對啊。
filtration和selection的區(qū)別是什么,結(jié)果都是篩出來要的
老師 想問一個比較general的問題,根據(jù)做題經(jīng)驗,如果考試中考regression,給出一個回歸方程數(shù)據(jù)圖,給出x的數(shù)值,然后讓你算y,這個時候我需要考慮b的顯著性然后過濾到不顯著的變量計算?還是不考慮然后直接帶入到所有的變量計算y值
Q4,整的序列自相關(guān)——平滑——SSE偏小怎么理解
講義中明確表示, token詞頻過高或過低都不好,為什么TF 以及 TF*IDF越高越好
42題,lag1的系數(shù)-0.8757,這個系數(shù)比較小檢驗結(jié)果是不顯著,那lag1的系數(shù)豈不是等于0?這么看的話,模型還能說準確嘛?答案是說沒有自相關(guān)的問題模型就是準確的
程寶問答