張同學(xué)
2023-04-24 13:10Stemming、Lemmatization、scaling、winsorization分別是什么操作,用在哪里
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2023-04-24 22:10
該回答已被題主采納
同學(xué)你好。
stemming:詞干提取,像我們英語中學(xué)過構(gòu)詞法,一個單詞通過加各種前綴后綴改變詞性等意思,詞干提取就是換元詞干。例如stemming,是stem的-ing形式,,在詞干提取時提取stem。
Lemmatization:詞根還原,例如analysis、analyzing詞根為analyze;
winsorization:將大異常值替換為最大值和將小異常值替換為最小值;
scaling:縮放比例,例如例如從1到100數(shù)據(jù)特別分散,我使用縮放比例來刻畫這組數(shù)據(jù),例如最大是101,最小是1,那么數(shù)據(jù)50就是0.49(50-1)/(101-1),這是縮放的一種手法,將這組數(shù)據(jù)集中在0-1中間。
這些手法都用在數(shù)據(jù)的預(yù)處理階段。
同學(xué)如果回答解決了您的疑惑,請給回答給予采納。祝早日持證!
