Leo
2022-05-10 22:47bag_of_words是否等于set_of_N-grams?第九題為什么B不正確呢?
所屬:CFA Level II > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
Essie助教
2022-05-11 10:48
該回答已被題主采納
你好,第三步所得出的結(jié)果是詞包(BOW),他是經(jīng)過tokenization和normalization之后所得出的,本題選A。它不等于set-of N-grams,因為BOW只收集所有單詞或標識符,但不考慮單詞出現(xiàn)的順序和位置。而N-grams很好的解決了這一點,如果文本的順序很重要,則可以使用N元分詞來表示單詞序列。
