Ava
2023-07-17 13:02PCA和clustering都只真是線性嗎,原因是什么?
PCA圖里放哪里
所屬:CFA Level II > Quantitative Methods 視頻位置 相關試題
來源: 視頻位置 相關試題
1個回答
愛吃草莓的葡萄助教
2023-07-18 11:47
該回答已被題主采納
同學你好。首先需要弄清楚PCA與clustering代表的是什么。PCA是算法,clustering是機器學習問題類型之一。
線性與非線性講的是數(shù)據(jù)是否復雜。
PCA算法是降維問題中的算法,既可以用于復雜的非線性數(shù)據(jù)也可以用于線性數(shù)據(jù)。
聚類問題在非線性數(shù)據(jù)情況下可以使用神經(jīng)網(wǎng)絡算法,在非復雜數(shù)據(jù)情況下可以使用K均值聚類或者分層聚類算法。
投資更加優(yōu)秀的自己?? ~如果滿意回復可【采納】,仍有疑問可【追問】,您的聲音是我們前進的源動力,祝您生活與學習愉快!~
-
追問
1.課程里這兩種都是處理數(shù)據(jù)的不同算法,如下圖。你這里說聚類不是算法?
聚類是只針對分類變量,非監(jiān)督,線性嗎?圖里老師說的線性,你說的非線性?
2.PCA對數(shù)據(jù)線性非線性沒有要求是嗎?監(jiān)督和非監(jiān)督也沒要求?變量是分類還是連續(xù)呢? -
追問
另外還想問下,監(jiān)督和非監(jiān)督都只能用于分類變量,不能用于連續(xù)變量嗎?
-
追答
額,同學你這里全部都是糊的,基礎概念都沒有分清楚,建議重新看一下機器學習算法分類的視頻。
首先機器學習根據(jù)是否有標簽庫分為監(jiān)督學習與非監(jiān)督學習,監(jiān)督學習可以用于處理回歸與分類問題,非監(jiān)督學習可以用于處理降維與聚類問題。
其次處理這些問題需要算法,例如PCA、CART等,這些算法不是每一類問題都可以處理。需要根據(jù)問題的類型與數(shù)據(jù)的復雜程度選擇算法。
聚類問題屬于非監(jiān)督學習,它可以選擇不同算法進行學習,這取決于數(shù)據(jù)的復雜程度,數(shù)據(jù)復雜可以選擇神經(jīng)網(wǎng)絡,不太復雜可以選擇K均值聚類等。老師那一行寫的都是算法,聚類那里應該是K均值聚類或者分層聚類,省略了幾個字,所以并沒有任何不對的地方。
PCA是算法,用于解決降維問題,降維問題屬于非監(jiān)督學習,幸運的是降維問題中不論數(shù)據(jù)是否復雜都可以使用PCA算法。
監(jiān)督或非監(jiān)督講的是數(shù)據(jù)是否有標簽,分類或連續(xù)講的是變量/問題是否連續(xù),這時兩個維度。數(shù)據(jù)有標簽適用于監(jiān)督學習,如果數(shù)據(jù)/問題還是定性的,那么就是分類問題;如果是定量的(連續(xù)),那么就是回歸問題。
投資更加優(yōu)秀的自己?? ~如果滿意回復可【采納】,仍有疑問可【追問】,您的聲音是我們前進的源動力,祝您生活與學習愉快 -
追問
那這里要先判定數(shù)據(jù)是非線性,才能考慮使用降維?講降維時候是在非線性,但這總結時候是先判斷是否需要降維?沒有考慮非線性?
線性數(shù)據(jù)不適用監(jiān)督和非監(jiān)督,也沒有打標簽一說嗎? -
追答
同學你好。建議根據(jù)老師的回復認真回看一下視頻,將算法分類理清,顯著相關概念理解完全都是糊的。
1)之前老師的兩次回復均提到,降維、聚類、回歸、分類,這是機器學習的四類問題 ,是根據(jù)機器學習類型劃分的,即非監(jiān)督學習是前兩個,監(jiān)督學習是后兩個問題。不是看數(shù)據(jù)是否是線性來判斷是哪個問題。
2)降維問題的算法選擇也需要考慮數(shù)據(jù)是否復雜,但是數(shù)據(jù)復雜與不復雜都可以使用PCA算法,因此還區(qū)分干嘛;
3)線性數(shù)據(jù)與監(jiān)督/非監(jiān)督一個是牛頭一個是馬嘴,都不搭邊。老師之前說了,線性不線性看的是數(shù)據(jù)是否復雜,而監(jiān)督/非監(jiān)督看的是數(shù)據(jù)有沒有標簽。數(shù)據(jù)有標簽可以用監(jiān)督學習,有標簽數(shù)據(jù)他也可以是復雜的也可以不是復雜的;數(shù)據(jù)沒有標簽可以用非監(jiān)督學習,沒有標簽數(shù)據(jù)他也可以是復雜非線性也可以是簡單線性的數(shù)據(jù)。并沒有線性數(shù)據(jù)不適用監(jiān)督和非監(jiān)督,如果不適用那適用什么,機器學習分為監(jiān)督學習與非監(jiān)督學習,這兩個不適用又沒有第三個學習。
建議同學回看相關視頻并根據(jù)老師的回復厘清基礎分類知識,如果實在不行那就背住老師的回復。 -
追問
我提問寫錯了,我是要問連續(xù)變量不做監(jiān)督非監(jiān)督學習的區(qū)分對嗎?
-
追答
同學你好。在監(jiān)督與非監(jiān)督學習下,會對數(shù)據(jù)類型進行劃分,即分類數(shù)據(jù)和連續(xù)數(shù)據(jù)。監(jiān)督學習下數(shù)據(jù)可能是分類數(shù)據(jù)也可能是連續(xù)數(shù)據(jù),非監(jiān)督學習下數(shù)據(jù)可能是分類數(shù)據(jù)也可能是連續(xù)數(shù)據(jù)。
監(jiān)督學習下如果數(shù)據(jù)是分類數(shù)據(jù),那么是分類問題;監(jiān)督學習下如果數(shù)據(jù)是連續(xù)數(shù)據(jù),那么是回歸問題;
非監(jiān)督學習下如果數(shù)據(jù)是分類數(shù)據(jù),那么是聚類問題;非監(jiān)督學習下如果數(shù)據(jù)是連續(xù)數(shù)據(jù),那么是降維問題;
-
回復愛吃草莓的葡萄:比課程里的老師總結的清楚明白,建議親直接去講課吧,感謝回復。
