momo
2023-03-24 08:54結(jié)構(gòu)化數(shù)據(jù)跟非結(jié)構(gòu)化數(shù)據(jù)在exploration step這一步哪里不一樣?
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
愛(ài)吃草莓的葡萄助教
2023-03-24 10:01
該回答已被題主采納
同學(xué)你好。數(shù)據(jù)探索步驟主要有數(shù)據(jù)探索性分析(EDA)、特征選擇(feature selection)和特征工程(feature engineering)這三步。對(duì)于結(jié)構(gòu)性數(shù)據(jù)與非結(jié)構(gòu)性數(shù)據(jù)而言,這三個(gè)操作的方法有所不同。
對(duì)于結(jié)構(gòu)性數(shù)據(jù)EDA有統(tǒng)計(jì)量指標(biāo)與可視化圖形等,特征選擇可以是依據(jù)統(tǒng)計(jì)量排序選擇最重要的特征,特征工程可以是將原有的特征轉(zhuǎn)化為更有意義的特征;
對(duì)于非結(jié)構(gòu)性數(shù)據(jù)EDA為分類、聚類、文本分析等,特征選擇方法有頻數(shù)計(jì)量等,特征工程有實(shí)體名稱識(shí)別(Name entity recognition)等
