137****0129
2024-02-28 11:31Q1, 題目有說Bector then computes TF–IDF for several words…,所以為什么不是TF- IDF,而是TF?這里的words和前面的token區(qū)別是什么
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
Huang助教
2024-02-28 16:18
該回答已被題主采納
同學(xué)你好,
TF–IDF是兩個(gè)部分:term frequency-inverse document frequency
term frequency 是單個(gè)文件的某個(gè)詞出現(xiàn)的頻率。
document frequency 只整個(gè)文件集中,出現(xiàn)了某個(gè)次的文件出現(xiàn)的頻率。
這一題問的是詞出現(xiàn)的頻率,就是看term frequency。
Token是文本單位的,例如可以把一個(gè)詞分成幾個(gè)token。
-----------------------------------
如果滿意答疑可【采納】,仍有疑問可【追問】
