老師在另一題講mutual information的時(shí)候,還有這題講df的時(shí)候都說的是,出現(xiàn)頻次越低越重要,但是在這題的第一題又說了出現(xiàn)頻次最高和最低的都是廢詞。請(qǐng)問怎么區(qū)分這兩種情況?
視頻中老師說VIF小于5,則不存在多重共線性,這個(gè)臨界值應(yīng)該是10吧?超過5只是需要關(guān)注,超過10才是多重共線性啊
老師,hii>3((k+1)/n)的公式是怎么來的?
general F檢驗(yàn)是二級(jí)考點(diǎn)嗎?
感覺AR下的CH和Autocorrelation好像啊,都是error之間有corr
老師,所以IDF是一個(gè)越高越好的指標(biāo)對(duì)嗎?那TF-IDF呢,也是越高越好嗎?
第五題看不懂,可以詳細(xì)解釋一下嗎
分子和分母不就是方差除以方差么?
課件和沖刺筆記這兩處(藍(lán)框)不一致,以哪個(gè)為準(zhǔn)?
C選項(xiàng)是啥?麻煩詳細(xì)介紹一下
這兩個(gè)AR,有啥區(qū)別?
這個(gè)是啥意思?詳細(xì)介紹一下
第三題中給到自變量數(shù)據(jù) assuming MRKT is 0.9%, the return on value stocks is 1.2%, the return on growth stocks is 3.8%, the return on small-cap stocks is 4.0%, and return on large-cap stocks is 2.2%.為什么計(jì)算時(shí)用的不是1.2%,3.8%,4%和2.2%,而是1.2、3.8、4、2.2?
表3最后一列的p-value,好像跟印象里的p-value不一樣。印象中,檢驗(yàn)統(tǒng)計(jì)量比p值小,就說明可以拒絕原假設(shè)。表3中的p值怎么理解和使用呢?
1.TF里面句子里總詞數(shù),是一個(gè)文檔中所有句子的總次數(shù)嗎,還是只是一個(gè)句子。。,2、CF以語料集來看,分母是compus里面所有句子總數(shù)還是compus里面所有句子含有的總詞數(shù),分子呢,是含有這個(gè)詞的句子數(shù)還是句子里面的詞數(shù)?怎么判斷這個(gè)TF指的是TF的小范圍還是其實(shí)是CF的TF??搞出來這么多詞匯和定義,完全沒有意義。。。會(huì)考嗎
程寶問答