檸同學(xué)
2024-07-28 14:24完全看不懂解析,不知道如何下手
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個(gè)回答
黃石助教
2024-07-29 11:27
該回答已被題主采納
同學(xué)你好。這道題考察的是reinforcement learning中的Q-learning的具體應(yīng)用。其實(shí)從題目本身來說只要會(huì)套這兩個(gè)公式即可,其中S是state,A是action,alpha是一個(gè)參數(shù),叫做learning rate,R是reward,Q_old就是當(dāng)前的Q值,Q_new是新的Q值(當(dāng)machine采取了一個(gè)action,進(jìn)入了一個(gè)state后的Q值)。對(duì)于Q-learning的話通過一個(gè)例子來看會(huì)更好理解一些,見下圖。
