亞同學(xué)
2024-04-03 18:32第五題看不懂,可以詳細(xì)解釋一下嗎
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Huang助教
2024-04-05 01:35
該回答已被題主采納
同學(xué)你好,
在TF中,頻率非常高的詞會是一些停用詞,例如the,這個沒什么意義。
而頻率很低的詞是一些罕見的詞,因為只出現(xiàn)一兩次就沒什么分析的必要,對于分析這兩種詞都沒什么用。
TF很高和很低的詞被認(rèn)為是noisy terms。
原版書中的解釋:
Terms with low TF are mostly rare terms (like proper nouns), ones appearing only once or twice in the data. They do not contribute to differentiating sentiment.
Terms with high TF are mostly stop terms, present in most sentences, and so do not contribute to differentiating sentiment.
-
追問
怎么判斷他頻率是過高或過低呢?例如“the”的頻率是0.49,為什么就是高呢?
-
追答
題目里面已經(jīng)寫了這個是Exhibit 2 Words with Highest and Lowest Frequency Value,而且題干說了是based on Exhibit 2 來回答,這個不需要主觀判斷的,一般題目會給很明顯的字眼告訴你是過高還是過低。
