Kaki
2022-05-28 16:11為何第一問是指TF而不是TF–IDF的大???要如何分辨?
所屬:CFA Level II > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
Essie助教
2022-05-28 18:46
該回答已被題主采納
你好,根據(jù)文中第二段“Following an exploratory data analysis that revealed Dataset ABC’s most frequent tokens”,這里說的是數(shù)據(jù)庫中最常見的標識符,是和出現(xiàn)的頻次有關,因此指的是term frequency詞頻,詞頻也是整個語料庫中衡量的一個指標。
而TF-IDF是詞頻和逆向文件頻率的乘積,比如說更高的TF*IDF代表表示單詞在較少數(shù)量的文檔中出現(xiàn)的頻率更高,說明這個詞在文檔中的信息量越大。
而這里沒提到信息量等衡量的方式,只是說標識符出現(xiàn)的頻率。
