Shihairong
2024-05-04 17:55K mean clustering后續(xù)類中心或者質(zhì)心centroid的決定步驟是怎樣的,麻煩介紹一下
所屬:CFA Level II > Quantitative Methods 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
愛吃草莓的葡萄助教
2024-05-06 14:28
該回答已被題主采納
同學(xué)你好。K-means聚類算法,用于將數(shù)據(jù)集劃分為K個簇(cluster),其目標(biāo)是使得每個數(shù)據(jù)點與其簇中心的距離之和最小。算法的核心步驟包括初始化聚類中心、分配數(shù)據(jù)點到最近的聚類中心,以及更新聚類中心。
1. 初始化聚類中心:隨機選擇K個數(shù)據(jù)點作為初始聚類中心。
2. 分配數(shù)據(jù)點到最近的聚類中心:
- 對于數(shù)據(jù)集中的每一個數(shù)據(jù)點,計算它與每個聚類中心的距離。
- 將每個數(shù)據(jù)點分配到最近的聚類中心所代表的簇中。
3. 更新聚類中心:
- 當(dāng)所有數(shù)據(jù)點都被分配到簇后,計算每個簇的新中心。
- 新的聚類中心是簇內(nèi)所有數(shù)據(jù)點的均值,即對于每一個簇,計算所有屬于該簇的數(shù)據(jù)點的平均值,這個平均值就是新的聚類中心。
4. 迭代直至收斂:
- 重復(fù)步驟2和步驟3,直至滿足停止條件。停止條件可以是聚類中心的變化小于某個閾值,或者達(dá)到預(yù)設(shè)的迭代次數(shù)。
- 在每次迭代中,聚類中心的更新將導(dǎo)致數(shù)據(jù)點被重新分配到更合適的簇,最終達(dá)到一個穩(wěn)定狀態(tài),此時聚類中心不再有顯著變化。
-
追問
關(guān)于:新的聚類中心是簇內(nèi)所有數(shù)據(jù)點的均值,即對于每一個簇,計算所有屬于該簇的數(shù)據(jù)點的平均值,這個平均值就是新的聚類中心。
平均值的計算是不是每一點都有一個座標(biāo)(x,y),類中心的座標(biāo)為(西格瑪Xi/n,西格瑪Yi/n).
謝謝。 -
追答
同學(xué)你好。思路是的,但是是何種平均方法依具體情況而言。
