152****6172
2024-10-05 12:52這里knn和k-means有啥關(guān)系么?各自應(yīng)用能詳細(xì)說(shuō)一下么?
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來(lái)源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2024-10-09 11:31
該回答已被題主采納
同學(xué)你好。這兩種算法沒(méi)有什么關(guān)系,只不過(guò)名字中都帶了一個(gè)k。
KNN是一種監(jiān)督式學(xué)習(xí),主要是用作分類(lèi)(也可以用作回歸)。比方說(shuō)我現(xiàn)在要研究新發(fā)放的貸款是否會(huì)違約。當(dāng)前我的訓(xùn)練集中有諸如公司的信用評(píng)級(jí)、公司的財(cái)務(wù)指標(biāo)等一系列特征,且每個(gè)個(gè)體我都有對(duì)應(yīng)的label:違約/未違約?,F(xiàn)在假設(shè)我獲得了一個(gè)新觀測(cè)個(gè)體,我可以通過(guò)某些測(cè)量距離的指標(biāo)(歐幾里得距離或曼哈頓距離),來(lái)找到特征值距離這一新個(gè)體最近的k個(gè)訓(xùn)練集個(gè)體。比方說(shuō)k = 5,那就是找到5個(gè)最近的訓(xùn)練集個(gè)體。如果這5個(gè)個(gè)體中4個(gè)未違約,1個(gè)違約,那么我們就可以按少數(shù)服從多數(shù)的邏輯對(duì)新個(gè)體進(jìn)行分類(lèi):新個(gè)體不會(huì)違約。
K-means algorithm是一種非監(jiān)督式學(xué)習(xí),是研究數(shù)據(jù)結(jié)構(gòu)、對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)的一種算法。其做法是,隨機(jī)在訓(xùn)練集中取k個(gè)點(diǎn)作為質(zhì)心(centroid)的初始值,根據(jù)歐幾里得距離或曼哈頓距離將每個(gè)訓(xùn)練集個(gè)體聚類(lèi)到與其最近的點(diǎn)。接下來(lái),對(duì)于這k個(gè)聚類(lèi),我們可以重新計(jì)算其質(zhì)心(質(zhì)心其實(shí)就是中心的概念,也就是對(duì)于聚類(lèi)中每個(gè)特征取平均值得到的點(diǎn)),然后重復(fù)上述動(dòng)作:計(jì)算距離、聚類(lèi)、重新計(jì)算質(zhì)心。直到重新計(jì)算的質(zhì)心不再發(fā)生變動(dòng),算法就完成了,我們也得到了k個(gè)聚類(lèi)。這種方法可以用在比方說(shuō)客戶(hù)的聚類(lèi)上。
-
追問(wèn)
監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)主要目的就是是否帶有目的是么?能展開(kāi)說(shuō)說(shuō)么?
-
追答
同學(xué)你好。監(jiān)督式學(xué)習(xí)中,對(duì)于每個(gè)個(gè)體,都有特征(feature)以及目標(biāo)的取值(目標(biāo)是target,其取值被稱(chēng)為label),其核心目的在于預(yù)測(cè)(prediction)或分類(lèi)(classification)。計(jì)量經(jīng)濟(jì)學(xué)中的回歸就是一種最簡(jiǎn)單的監(jiān)督式學(xué)習(xí),我們可以通過(guò)學(xué)習(xí)訓(xùn)練集中個(gè)體的特征與目標(biāo)之間的關(guān)系并估計(jì)參數(shù),進(jìn)而對(duì)于每個(gè)給定的新個(gè)體的特征取值,都能夠進(jìn)行預(yù)測(cè)。非監(jiān)督式學(xué)習(xí)中,對(duì)于每個(gè)個(gè)體,只有特征,沒(méi)有目標(biāo),該算法的核心目的在于研究數(shù)據(jù)的結(jié)構(gòu),對(duì)數(shù)據(jù)本身進(jìn)行聚簇(clustering)。典型的例子比方說(shuō)主成分分析(通過(guò)一些數(shù)學(xué)手段,對(duì)數(shù)據(jù)本身進(jìn)行“打碎重組”,將原先的特征轉(zhuǎn)換為主成分,而通常前3個(gè)主成分就足以包含數(shù)據(jù)中絕大部分信息)。
-
追問(wèn)
好像估值那章和機(jī)器學(xué)習(xí)都有講主成分分析法是么?這區(qū)別是啥?
-
追答
同學(xué)你好。沒(méi)有區(qū)別,估值中PCA的部分是對(duì)于機(jī)器學(xué)習(xí)里PCA的一個(gè)很好的案例補(bǔ)充,是金融固定收益領(lǐng)域中PCA的一個(gè)經(jīng)典應(yīng)用。
