50****63
2023-09-13 06:26老師,請(qǐng)您解釋一下Document frequency的計(jì)算和含義。分母總句數(shù)是文件集的總句數(shù)還是單個(gè)文件的總句數(shù)?相應(yīng)的分子中的含有某個(gè)詞的文件數(shù)(“句數(shù)”)能說明是指文件集的總句數(shù)嗎?教材的一個(gè)例子中的分母2180這個(gè)數(shù)怎么來的,我沒看明白
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
愛吃草莓的葡萄助教
2023-09-13 10:27
該回答已被題主采納
同學(xué)你好。DF(文檔頻率)等于含有改詞的句子數(shù)在整個(gè)語料庫(kù)(文件集)中的占比。例如我搜集了幾篇文章匯總成一個(gè)語料庫(kù),可以得知整個(gè)語料庫(kù)的句子數(shù)為30000,如果含有創(chuàng)新標(biāo)記的句子數(shù)有5000,那么DF=5000/3000.
2180是題目已經(jīng)給出的,在整個(gè)語料庫(kù)中總的句子數(shù)為2180.
