宇同學(xué)
2024-06-22 10:14Q2在沖刺筆記里面page75.里面說的TF(term frequency)是在句子級別而不是collection level,在Max Porter這個案例里面的Q3第二個選項里面有提到過,這里上課的時候老師怎么又變成了單詞在整個語料庫中單詞出現(xiàn)的頻率?(http://www.h8045.cn/home/#/REX/9933/exam/1927154/3/analyze/1927154/1)
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2024-06-24 13:52
該回答已被題主采納
同學(xué)你好。TF有兩個層面的計算,一個是在整個語料庫層面的計算,一個是在句子層面的計算,這個在基礎(chǔ)課中有講過,并且有計算。你提到的P75,TF的那段話講的是在整個語料庫層面的含義,下面的TF計算公式是在句子層面的含義。因此,并非講的有問題,而是同學(xué)沒有掌握基礎(chǔ)課中學(xué)的TF的兩個層面。
TF-IDF中是句子層面的TF乘上IDF,這是TF-IDF的定義。
