A级片三级毛片中文字幕|97人人干人人爱|aaaaa毛片亚洲av资源网|超碰97在线播放|日本一a级毛片欧美一区黄|日韩专区潮吹亚洲AV无码片|人人香蕉视频免费|中文字幕欧美激情极品|日本高清一级免费不卡|国模大胆在线国产啪视频

AQF
首頁 備考指南 精品課程 名師團隊 職業(yè)前景
您現(xiàn)在的位置:首頁職業(yè)前景行業(yè)動態(tài) 手把手教你錯誤地使用人工智能做投資

手把手教你錯誤地使用人工智能做投資

發(fā)表時間: 2019-04-02 11:26:22 編輯:tansy

一時間,使用人工智能和機器學習進行投資再次成為輿論的核心。這不是“機器學習選股(或投資)”第一次站上風口浪尖。

  一、人工智能 ETF AIEQ 橫空出世

  2017 年 10 月 18 日,一個名為“AIEQ”的 ETF 基金在美國橫空出世,刷爆了投資圈。它的全名是 AI Powered Equity ETF,是全球首支人工智能 ETF。這支 ETF 有什么來頭呢?

  “AIEQ 由舊金山 EquBot 公司推出,該公司是 IBM 全球創(chuàng)業(yè)者計劃的一部分,并與 ETF Managers Group 合作,利用 IBM Watson 超級計算機進行大數(shù)據(jù)處理,并分析美國境內(nèi)投資機會,對股票投資進行主動管理。

  據(jù)媒體報道,AIEQ 利用人工智能和機器學習,對全美 6000 多家上市公司進行分析,構(gòu)建上百萬份資料和眾多金融模型,從當前經(jīng)濟形勢、未來趨勢以及公司重大事件等方面進行深度分析后,再挑選出包含 70 支股票的投資組合。

  股票選好后,將由 ETF Managers Group 的一個基金經(jīng)理團隊對投資組合進行再權(quán)衡。”

  上面的介紹中有足夠多的熱詞吸引眼球:“人工智能”、“機器學習”、“IBM Watson 超級計算機”、“大數(shù)據(jù)”、“上百萬份資料和眾多金融模型”、“深度分析”……

  這支 ETF 也確實不負眾望,自推出以來的頭三天確實戰(zhàn)勝了標普 500 指數(shù)(下圖)。

  如何利用人工智能做投資

  于是,金融圈沸騰了,懂行的和不懂行的媒體更是炸鍋了,紛紛大肆報道,毫無理智可言的吹捧這支黑箱滿滿的人工智能 ETF:

  如何利用人工智能做投資

  一時間,使用人工智能和機器學習進行投資再次成為輿論的核心。>>>點擊咨詢?nèi)绾稳腴T量化金融?

Python量化期權(quán)實戰(zhàn)課程

  這不是“機器學習選股(或投資)”第一次站上風口浪尖。早在今年三、四月份,世界上最大的投資管理公司貝萊德就宣布使用機器代替基金經(jīng)理,自此宣告了人工智能將要取代人類開始征服投資界。那時我寫了一篇題為《為什么機器學習在投資領(lǐng)域不好使》的文章,闡述了如下觀點:

  “雖然身處并堅定地看好量化投資領(lǐng)域,但我對“機器學習在選股上能取代人類”這個觀點上持保守和謹慎的態(tài)度。這是因為金融分析屬于非實驗性科學,因此無法進行對照實驗。這意味著雖然存在大量的金融交易數(shù)據(jù),但是無法通過設(shè)計實驗來控制自變量的變化、通過重復性試驗來檢驗提出的假設(shè)(比如說機器學習發(fā)現(xiàn)的某種選股模式)。如此的數(shù)據(jù)分析得到的大多是看似顯著但實際上是欺騙式的模式(尤其對樣本外數(shù)據(jù)),這個現(xiàn)象稱作數(shù)據(jù)遷就。”

  毋庸置疑,通過學習大量的投資品量價數(shù)據(jù)、上市公司的財報數(shù)據(jù)、互聯(lián)網(wǎng)上有關(guān)這些公司的熱搜輿情數(shù)據(jù)、分析師投研數(shù)據(jù)等,機器學習一定能發(fā)現(xiàn)一些在樣本內(nèi)可以賺錢的模式。但我們真正關(guān)心的是:這個策略到底是在茫茫歷史數(shù)據(jù)中找到了虛假的模式,還是一個真正能從投資邏輯上給出合理解釋的科學模式?面對機器學習這個黑箱,如果我們不能從業(yè)務(wù)層面弄清楚這個模式為什么有效,又怎敢拿真金白銀按照這個模式來投資呢?

  本文就以機器學習中的經(jīng)典有監(jiān)督分類算法——支持向量機(support vector machine,SVM)——為例,說明如果毫無保留的相信機器學習而忽視投資業(yè)務(wù)邏輯的重要性,那么很容易掉入數(shù)據(jù)遷就的陷阱并找到特征和收益率之間的虛假模式;我們甚至會試圖給這種模式找一個看似有理的解釋。這無疑會導致投資的失敗。

  本文題為“手把手教你錯誤地使用人工智能做投資”,目的不是為了否定人工智能和機器學習在投資實務(wù)中的潛力,而是為了提醒讀者——同時也是為了鞭策自己——在投資中要對人工智能能夠做到什么有個正確的認知,在使用機器學習算法時應(yīng)該避開各種潛在的陷阱。

  二、、使用 SVM 發(fā)現(xiàn)投資模式

  SVM 是一種非常強大的有監(jiān)督學習分類算法。它可以發(fā)現(xiàn)特征向量(feature)和標簽(label)之間的關(guān)系。

  本文的例子以中證 500 指數(shù)作為投資標的并使用日頻數(shù)據(jù),以兩個窗口的收益率變量和代表交易日是星期幾的五個啞變量作為特征向量,以交易日收益率的相對取值大小作為標簽,通過 SVM 進行分類。

  具體的,這七個特征如下:

  1. 前 5 日的累積收益率。

  2. 前 10 到前 6 日的累積收益率。

  3. 代表星期一的啞變量:如果交易日是周一則該變量為 1;否則為 0。

  4. 代表星期二的啞變量:如果交易日是周二則該變量為 1;否則為 0。

  5. 代表星期三的啞變量:如果交易日是周三則該變量為 1;否則為 0。

  6. 代表星期四的啞變量:如果交易日是周四則該變量為 1;否則為 0。

  7. 代表星期五的啞變量:如果交易日是周五則該變量為 1;否則為 0。

  樣本內(nèi)數(shù)據(jù)的窗口為 2016 年 3 月 1 日到 2017 年 10 月 20 日,即股災(zāi) 3.0 之后的交易數(shù)據(jù)作為樣本。注意,這里我們犯了第一個錯誤。雖然有“股災(zāi) 3.0 之后”這個冠冕堂皇的理由,但是這里出現(xiàn)了數(shù)據(jù)遷就,即我并不試圖在更寬的時間窗口內(nèi)進行機器學習,而是僅在一個我事先決定的窗口內(nèi)進行分析。一個真正從投資邏輯業(yè)務(wù)出發(fā)的模式不應(yīng)該僅僅在這么短的窗口內(nèi)有效。

  為了特征向量之間的可比性,對它們進行標準化,即令每個特征向量的均值為 0,標準差為 1。如此處理后便得到特征向量矩陣。樣本內(nèi)前幾個交易日的特征向量矩陣如下。

  如何利用人工智能做投資

  下面來說說如何處理標簽。SVM 的目的是將這些交易日按照特征向量分成不同的兩類。從投資的角度來說,那就是收益率高和收益率低的兩類(記為 1 和 0)。因此根據(jù)每個交易日的收益率,可以有以下幾種加標簽的方法:

  1. 以 0 作為分界線,收益率為正的交易日標簽為 1;收益率為負的交易日標簽為 0;

  2. 以收益率的均值為分界線,收益率大于均值的交易日標簽為 1;收益率小于均值的交易日標簽為 0;

  3. 以收益率中位數(shù)為分界線,收益率大于中位數(shù)的交易日標簽為 1;收益率小于中位數(shù)的交易日標簽為 0。

  這三種方法的準確率如下:

  如何利用人工智能做投資

  雖然以 0 為基準的整體準確率較高,但是從做多策略能賺錢的角度來說,猜漲準確率更加重要。在這方面,后兩種基準似乎更有效。又因為較均值來說,中位數(shù)不受異常值的影響,因此最終我們選擇以中位數(shù)為基準對樣本加標簽。

  上述推導看似“合情合理”,但我們無意中又踏入了第二個錯誤:僅僅追求樣本內(nèi)分類的準確性。

  特征向量矩陣和標簽向量都準備好之后,就可以使用 SVM 進行有監(jiān)督學習了。為了能夠解釋特征的重要性,我們采用線性核(linear kernel)。具體計算中,采用 python 的 scikit learn 擴展包中的 SVM 函數(shù)。采用線性核時,特征向量的權(quán)重代表了特征向量的重要性。這些特征向量的權(quán)重為:

  如何利用人工智能做投資

  從特征向量的權(quán)重來看,兩個收益率變量和星期四啞變量的重要性和其他幾個向量完全不是一個數(shù)量級。對于其他幾個啞變量來說,星期一和星期二這兩個啞變量的權(quán)重為正,說明它們對分到標簽為 1 的類(即收益率大于中位數(shù))有正貢獻。

  從上述結(jié)果中我們可以推斷出,在這些特征向量中,星期一和星期二這兩個啞變量對于“猜漲”(分到標簽為 1 的類)最關(guān)鍵。這就是我們用機器學習得到的模式。

  三、錯誤的模式和“合理”的解釋

  經(jīng)過 SVM 學習,我們得到了一個模式——星期一和星期二這兩個交易日和收益率之間有“正”的關(guān)聯(lián)。為此,構(gòu)建一個策略:

  在星期一和星期二持倉;在其他交易日空倉。假設(shè)交易成本單邊萬分之三。

  在樣本內(nèi),該策略在我們的投資標的即中證 500 上的效果如下:

  如何利用人工智能做投資

  該策略的年化收益率為 15.1%,夏普率 1.22,最大回撤 -9.1%。同期指數(shù)本身的年化收益率為 11.8%,夏普率 0.47,最大回撤 -14.4%??梢?,策略以更低的風險(因為每周僅持倉兩天)換來了更高的收益(因此更高的夏普率),效果遠超指數(shù)本身。

  這無疑令人激動,因此我們毫不猶豫的邁入第三個錯誤:給策略找“合理”的解釋。

  由于這個策略是數(shù)據(jù)驅(qū)動的而非從業(yè)務(wù)實際出發(fā),因此為了說(蒙)服(蔽)自己,我們給它找了幾個牽強附會的理由:

  1. 日歷效應(yīng)存在于歐美股市中,反應(yīng)了市場的非有效性。因此在我國股市中存在星期一和星期二這種日歷效應(yīng)也是可能的。

  2. 股災(zāi) 3.0 之后,股市呈現(xiàn)出健康新常態(tài),即長期來看價值投資回歸,股市收益率呈現(xiàn)出慢牛的正漂移率。每個周末出現(xiàn)的消息中利好消息多于利空消息,因此周一更有可能出現(xiàn)上漲。

  3. 即便周末出現(xiàn)利空消息造成周一下跌,投資者的過度反應(yīng)往往造成周一超跌,因此股價在周二會有一波反彈;反之如果出現(xiàn)利好消息造成周一大漲,投資者的反應(yīng)不足會造成周二繼續(xù)跟進,再漲一波。

  我們用上面這些“看似合理”的解釋強迫自己接受 SVM 發(fā)現(xiàn)的這個星期一星期二交易的模式。但不難發(fā)現(xiàn),上面的解釋僅僅是出自投資者的行為偏差以及我們的一個根本假設(shè)“即市場進入了慢牛新格局”。上述解釋中沒有任何來自投資業(yè)務(wù)邏輯的能夠站得住腳的原因;而對于那個假設(shè)也沒有給出任何分析。

  再來看看這個策略在樣本外的表現(xiàn)。由于我們使用了最近的數(shù)據(jù)作為樣本內(nèi)的學習數(shù)據(jù),因此這里使用 2016 年 3 月 1 日之前的數(shù)據(jù)作為樣本外數(shù)據(jù)。此外,考察三個不同的窗口,即 2005/01/01 到 2016/02/28,2012/01/01 到 2016/02/28,和 2014/11/01 到 2016/02/28。

  如果一個選股模式真的在業(yè)務(wù)上有效,那么它應(yīng)該在不同的回測期內(nèi)都有不錯的效果。

  下面的結(jié)果說明,SVM 發(fā)現(xiàn)的這個樣本內(nèi)有效的模式在樣本外完全無效。

  如何利用人工智能做投資

  如何利用人工智能做投資

  這時,讓我們來看我們能犯的最后一個錯誤:為模式開脫。雖然策略在 2016 年 3 月 1 日之前無效,但我們“并不慌張”,并使用如下的論證安慰自己:中國股市從一定程度上來說是一個政策市,顯然股災(zāi) 3.0 前后的政策是不同的,因此以股災(zāi) 3.0 之后為樣本發(fā)現(xiàn)的模式在股災(zāi) 3.0 之前的數(shù)據(jù)中無效是正常的。我們需要做的是往后看,只要這個模式在今后有效就可以了。

  怎么樣?又一個冠冕堂皇的解釋。但不要忘了,這里仍然存在著我們反復強調(diào)的兩個問題:1. 這個模式背后缺少嚴謹?shù)耐顿Y邏輯做支撐;2. 沒有任何人保證今后不會發(fā)生新的政策變化而且變化被發(fā)現(xiàn)一定是滯后的,因此即便這個模式合理也無法說明它會持續(xù)有效(況且它還不合理)。

  好了,現(xiàn)在可以結(jié)束關(guān)于這個錯誤使用機器學習的例子的討論了。在這個手把手的錯誤教程中,我們先后犯了四個錯誤:

  1. 數(shù)據(jù)遷就——選擇看似有效的回測期。

  2. 過度關(guān)注樣本內(nèi)的分類效果。

  3. 繞過投資業(yè)務(wù)邏輯來解釋機器學習發(fā)現(xiàn)的模式。

  4. 為模式在樣本外的無效性開脫。

  因此,雖然人工智能發(fā)現(xiàn)了一個模式,但我們是不敢也不會使用的。

  四、再來看看 AIEQ

  讓我們再來看看 AIEQ。自推出以來,它經(jīng)歷了 5 個交易日。以 10 月 18 日的開盤價作為各自的基準,比較 AIEQ (藍線)和標普 500 指數(shù)(綠線)在這 5 個交易日的表現(xiàn)來看,標普反敗為勝。諷刺的是,當 AIEQ 由于前三天的高光表現(xiàn)而被媒體大肆吹捧之后,它就在第四個交易日一步走下神壇。僅從這 5 個交易日來看,和標普 500 相比,它似乎有高 β 和負 α。

  如何利用人工智能做投資

  先不說 AIEQ 的規(guī)模僅有 700 萬美元左右,僅僅通過三天的表現(xiàn)就引來媒體相繼吹捧實在是令人大跌眼鏡。巴菲特是在進了福布斯富人排行榜后才真正有人關(guān)注的,那時候他已經(jīng)堅持價值投資幾十年了。一兩年的業(yè)績出來吹都容易被打臉(更何況是三天),要想站得住腳必須經(jīng)歷過一個甚至多個大的市場周期。從這個角度來說,人工智能和機器學習要想在投資上證明自己還有很長的路要走。隨著人們對投資實務(wù)的認識越來越深刻以及機器學習算法的發(fā)展,我愿意相信人工智能在未來會在投資中發(fā)揮舉足輕重的作用。

  在追求更穩(wěn)健收益的道路上,人工智能應(yīng)該成為人類交易員的朋友,優(yōu)勢互補。一個業(yè)績被市場認可的基金經(jīng)理的投資邏輯和對市場的研讀是不應(yīng)該被機器學習取代的。但是從成本的角度,似乎不難理解人工智能在投資界普及的原因。面對越來越高昂的 α 收益率,開源不行,就要想辦法節(jié)流。最終投資市場的均衡狀態(tài)是超額收益的邊際成本恰好等于超額收益。成本高的基金終將不斷被成本低的基金擠出市場。

  作者:石川,北京量信投資管理有限公司創(chuàng)始合伙人,清華大學學士、碩士,麻省理工學院博士。知乎專欄:

  https://zhuanlan.zhihu.com/mitcshi。

  AQF在線咨詢

  金程推薦: AQF就業(yè)前景 AQF年薪 量化金融分析師年薪

  AQF考友群:760229148

  金融寬客交流群:801860357

  微信公眾號:量化金融分析師

  >>>返回首頁

吐槽

對不起!讓你吐槽了

/500

上傳圖片

    可上傳3張圖片

    2001-2025 上海金程教育科技有限公司 All Rights Reserved. 信息系統(tǒng)安全等級:三級
    中央網(wǎng)信辦舉報中心 上海市互聯(lián)網(wǎng)舉報中心 不良信息舉報郵箱:law@gfedu.net
    滬ICP備14042082號 滬B2-20240743 通過ISO9001:2015 國際質(zhì)量管理體系認證 滬公網(wǎng)安備31010902103762號 出版物經(jīng)營許可證 電子營業(yè)執(zhí)照

    掃描二維碼登錄金程網(wǎng)校

    請使用新版 金程網(wǎng)校APP 掃碼完成登錄

    登錄即同意金程網(wǎng)校協(xié)議及《隱私政策》