阿同學
2023-06-26 18:03CF, TF, DF, IDF, TF-IDF公式特點對比
所屬:CFA Level II > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
愛吃草莓的葡萄助教
2023-06-27 10:07
該回答已被題主采納
同學你好。
TF是詞頻,有兩層分類,一類是在整個語料庫層面又稱為(collection frequency),TF=總的該單詞出現(xiàn)次數(shù)/整個語料庫單詞數(shù);一類是在句子層面,TF=在句子中出現(xiàn)該單詞次數(shù)/句子單詞總數(shù)。
DF是文本頻率,DF=含有該單詞的句子數(shù)/總的句子數(shù)。
IDF是逆向文本頻率,衡量一個術語在整個語料庫中的獨特性的相對指標,IDF=log(1/DF)。
TF–IDF,句子層級的TF乘以整個數(shù)據(jù)集單詞的IDF,TF-IDF = TF × IDF.
