xx
2022-10-24 10:53supervised_learning就是structued_data呀,unsupervised_learning有一部分也是
所屬:CFA Level I > Portfolio Management 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
Evian, CFA助教
2022-10-31 00:19
該回答已被題主采納
ヾ(?°?°?)??你好同學(xué),
非監(jiān)督學(xué)習(xí):
根據(jù)沒有被標(biāo)記樣本數(shù)據(jù),找到其中的規(guī)律。
這個過程中不設(shè)置限制,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)都可以作為樣本數(shù)據(jù)
如下截圖:
非結(jié)構(gòu)化數(shù)據(jù):沒有按照預(yù)定義的方式組織或缺少特定數(shù)據(jù)模型的數(shù)據(jù),比如我們常見的文章、對話等等。包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等
結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)點之間具有清晰的、可定義的關(guān)系,并包含一個預(yù)定義的模型的數(shù)據(jù)??梢源嬖跀?shù)據(jù)庫中。
機器學(xué)習(xí)常用方法:主要分為有監(jiān)督學(xué)習(xí)(supervised learning)和無監(jiān)督學(xué)習(xí)(unsupervised learning)。
監(jiān)督學(xué)習(xí):人們常說的分類,通過已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對應(yīng)的輸出)去訓(xùn)練得到一個最優(yōu)模型(這個模型屬于某個函數(shù)的集合,最優(yōu)則表示在某個評價準(zhǔn)則下是最佳的),再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進(jìn)行簡單的判斷從而實現(xiàn)分類的目的,也就具有了對未知數(shù)據(jù)進(jìn)行分類的能力。在人對事物的認(rèn)識中,我們從孩子開始就被大人們教授這是鳥啊、那是豬啊、那是房子啊,等等。我們所見到的景物就是輸入數(shù)據(jù),而大人們對這些景物的判斷結(jié)果(是房子還是鳥?。┚褪窍鄳?yīng)的輸出。當(dāng)我們見識多了以后,腦子里就慢慢地得到了一些泛化的模型,這就是訓(xùn)練得到的那個(或者那些)函數(shù),從而不需要大人在旁邊指點的時候,我們也能分辨的出來哪些是房子,哪些是鳥。
無監(jiān)督學(xué)習(xí)(也有人叫非監(jiān)督學(xué)習(xí),反正都差不多)則是另一種研究的比較多的學(xué)習(xí)方法,它與監(jiān)督學(xué)習(xí)的不同之處,在于我們事先沒有任何訓(xùn)練樣本,而需要直接對數(shù)據(jù)進(jìn)行建模。這聽起來似乎有點不可思議,但是在我們自身認(rèn)識世界的過程中很多處都用到了無監(jiān)督學(xué)習(xí)。比如我們?nèi)⒂^一個畫展,我們完全對藝術(shù)一無所知,但是欣賞完多幅作品之后,我們也能把它們分成不同的派別(比如哪些更朦朧一點,哪些更寫實一些,即使我們不知道什么叫做朦朧派,什么叫做寫實派,但是至少我們能把他們分為兩個類)。
----------------------
學(xué)而時習(xí)之,不亦說乎??【點贊】鼓勵自己更加優(yōu)秀,您的聲音是我們前進(jìn)的源動力,祝您生活與學(xué)習(xí)愉快!~
