Q1 P=2.188/3.188 分母這個3.188怎么得到的?
這道題參數(shù)的顯著性怎么判斷的
這里數(shù)據都是labeled所以是supervised learning,那supervised learning里的classification不是只能是二分類嗎?為什么老師這里說也可以三分類?三分類不就屬于多分類也就是clustering,被視作unsupervised learning???
前面剛說了TF越高越好,又說TF越高越是廢詞,那TF高的是要用還是不用。。。。。。。還是先去掉剩下的再取高的。。。。還是先取IDF低的,再根據詞選TF高的。。。。
1.TF里面句子里總詞數(shù),是一個文檔中所有句子的總次數(shù)嗎,還是只是一個句子。。,2、CF以語料集來看,分母是compus里面所有句子總數(shù)還是compus里面所有句子含有的總詞數(shù),分子呢,是含有這個詞的句子數(shù)還是句子里面的詞數(shù)?怎么判斷這個TF指的是TF的小范圍還是其實是CF的TF??搞出來這么多詞匯和定義,完全沒有意義。。。會考嗎
Q1 b0 b1檢驗沒理解。t>0.05 拒絕,看t值0.935和292.958的話 b0和b1都顯著不為0,signifiance of t 也就是p--value<0.05 拒絕,0.176不能拒絕,b0不顯著,b0=0 這矛盾了呀
數(shù)量第4章,LR-test,LR=-2(LLnull-log likelihood) |LL|越小,模型越好。 這里的|LL|是指LR=-2(LLnull-log likelihood)的絕對值嗎?謝謝
這里LR test原假設是受限嗎?極大似然估計值實際代表意義是什么?為什么越大越好,為什么值是負的?有沒有辦法能從本質上講講明白?極大似然估計是為了做什么,就為了看模型要多一些變量還是少一些嗎?
這個LR的公式有推導嗎?課上沒有講過LR的公式。怎么記憶?要記嗎?
如果是有qq圖的話,qq圖應該是什么樣
詞形還原是lemmentization,也就是needing變need, 詞干提取是increase提取increas,也就是stemming。是老師講錯了,還是網上的詞典和說明有錯??
一序和多序是什么意思?
第四條違反出現(xiàn)序列自相關,是自變量的還是殘差的?為什么關注的殘差?
1.這里序列自相關是驗證的殘差還是自變量啊?怎么判斷驗證的是什么? 2.原假設為什么是不存在?備擇是存在?備擇不是一般選擇希望的假設嘛,一般是希望部存在此類情況?
filtration和selection的區(qū)別是什么,結果都是篩出來要的
程寶問答