cat
2024-12-25 21:42如果chi-square看作是該詞出現(xiàn)的頻率,越高的chisquare代表出現(xiàn)頻率越高,
但是從mutual information來看出現(xiàn)頻率高的token,反而并不是discriminative的,那為什么chi-square高的token可以用用作訓練模型的feature呢?
所屬:CFA Level II > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
愛吃草莓的葡萄助教
2024-12-26 17:30
該回答已被題主采納
同學你好。Chi-Square是一種檢驗統(tǒng)計量,用于評估分類變量之間的關聯(lián)性。當將Chi-Square應用于文本數(shù)據(jù)時,它可以幫助確定哪些token與特定的類別或主題有更強的關聯(lián)。
