水同學(xué)
2023-10-13 05:43數(shù)量第7章的第26題,請老師講解一下,謝謝
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2023-10-13 11:14
該回答已被題主采納
同學(xué)你好。本題考察的是詞頻分析中各個指標(biāo)的定義或含義。
IDF是DF倒數(shù)的對數(shù),即IDF=log(1/DF)。
TF有兩種,一是在語料庫層面(collection),二是在句子層面(sentence)。而TF—IDF,講的是句子層面的TF乘以IDF。
TF-IDF值并不是固定不變的,它因數(shù)據(jù)集中文檔的數(shù)量而不同,因此,當(dāng)應(yīng)用于只有幾個文檔的數(shù)據(jù)集時,模型表現(xiàn)可能會有所不同。
