AQF關注丨機器學習工程師的邊界是什么?下文中三招教你打破!
01.機器學習工程師的邊界是什么?
大多數(shù)的事物都是有邊界的。那機器學習的邊界又是什么呢?

對,就是數(shù)學。掌握了數(shù)學這個機器學習的底層基礎,不僅可以加深對算法的理解,還能在模型優(yōu)化階段更加游刃有余。
02.如何打破邊界?
希望以下的內容能給你參考思路。
• 機器學習中的數(shù)學基礎
方法建議:將實際意義與興趣賦予看似枯燥的學習之后,盡量死磕最少必要知識。

上圖是個使用邏輯回歸判斷一個男生是否是一位合適的女婿的例子。
其中,Y=w1*身高+w2*品德+w3*財富+w4*顏值+w5*就可以表達為多項式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,通過Sigmoid函數(shù)后,轉化為該男生可能成為優(yōu)秀女婿的概率問題。
這里會涉及sigmoid函數(shù)、求導算法、梯度下降、正則項控制過擬合等數(shù)學知識。遇到問題解決問題,死磕關鍵點,才不會鉆入牛角尖,陷入數(shù)學知識的汪洋大海中孤立無援。
• 機器學習中的線性代數(shù)
方法建議:盡量將線性代數(shù)與現(xiàn)實意義結合起來
對于線性代數(shù),理解它與機器學習的關鍵在于:理解線性代數(shù)與現(xiàn)實世界的巧妙的耦合。

上圖中的x,y可以分別代表觀察事物的2個維度。
x,y各自有大量的線性組合,意味著事物的2個維度有大量不同的看法,
將這些看法用機器來進行計算、歸納、演繹,并組合大量個別的看法,抽離出符合大多數(shù)的平衡點,從而得出普遍適用的結論。這不就是一件奇妙的巧妙而耦合的事件嘛~
• 機器學習中的概率統(tǒng)計
方法建議:盡量將看似無味的概率統(tǒng)計知識與感興趣的話題結合起來理解
隱馬爾科夫(HMM)算法是機器學習中的一個概率圖模型,也是很多算法崗位面試中的考察難點。來自知乎的王蒟蒻,就用一個游戲的場景清楚的解釋了隱馬爾科夫(HMM)算法的原理。
我是一戰(zhàn)士,修煉出了三種戰(zhàn)斗形態(tài),分別為暴怒態(tài),正常狀態(tài)和防御態(tài)。同時我也會三個被動技能,分別是普通平A,爆擊(攻擊傷害翻倍),吸血(生命汲取)。
我在暴怒狀態(tài)下打出暴擊的概率是80%,打出吸血概率為5%;在平衡形態(tài)下,打出暴擊的比率為30%,打出吸血的概率是20%;在防御形態(tài)下,暴擊成功概率為5%,吸血概率為60%。
總結一下,戰(zhàn)士在不同狀態(tài)下能打出技能的概率不一樣。
本來,戰(zhàn)士這個職業(yè)在暴怒態(tài)時,身邊會有一圈紅光環(huán);防御態(tài)時,會有一圈藍光環(huán)。但是,現(xiàn)在我正在玩游戲,游戲突然出了個bug:有個傻x程序員改了游戲的代碼,他給寫崩了,從此戰(zhàn)士身邊光環(huán)都看不見了。那我沒法通過看腳下的光環(huán)知道戰(zhàn)士在爆什么狀態(tài)了。
話說,現(xiàn)在問題來了:由于看不到腳下光環(huán),我只能估計“戰(zhàn)士”在爆什么狀態(tài);但我現(xiàn)在打一boss,砍10次,發(fā)現(xiàn)8次都是暴擊,血嘩嘩地翻倍在掉,你覺得我這戰(zhàn)士最可能是爆了什么狀態(tài)?
所以,通過自己感興趣的話題來理解深奧的概率問題,就輕松很多了。
03.打破邊界的誤區(qū)
也許你早已意識到高等數(shù)學、線性代數(shù)、概率統(tǒng)計對做機器學習的重要性,也在積極補課中,于是一頭扎進大學的教材中。但埋頭死磕了好多次,每次都半途而費,學了很多,學到的很少。
因為教材始終更偏向理論。優(yōu)點是每一步都可靠,邏輯嚴謹;但缺點就是很難理解。
古語有云:“獨學而無友則孤陋而寡聞”,多人學習,協(xié)作學習能較快認識到打破機器學習邊界的誤區(qū),盡可能的使用合適的學習方法。
.png)

完善下表,48小時內查收全套AQF備考資料
.jpg)
AQF考試群:760229148
聲明▎更多內容請關注微信號量化金融分析師。原創(chuàng)文章,歡迎分享,若需引用或轉載請保留此處信息。




