自然語(yǔ)言處理可能如果沒(méi)有關(guān)注到人工智能方面的新聞的話可能大家都沒(méi)有聽(tīng)說(shuō)過(guò),量化交易相比大家會(huì)有一些知道的,量化交易是考AQF的時(shí)候需要學(xué)習(xí)的一部分,那么這兩者之間有什么關(guān)系嗎?
一、自然語(yǔ)言處理
自然語(yǔ)言處理(Natural Language Processing,以下簡(jiǎn)稱NLP)是人工智能和語(yǔ)言學(xué)領(lǐng)域的分支學(xué)科,主要是研究如何讓計(jì)算機(jī)處理及運(yùn)用自然語(yǔ)言,是人工智能的重要組成部分。自然語(yǔ)言處理廣義上分為兩大部分:自然語(yǔ)言理解(Natural Language Understanding,以下簡(jiǎn)稱NLU),自然語(yǔ)言生成(Natural Language Generation,以下簡(jiǎn)稱NLG)。
NLU想要達(dá)到的目的是讓計(jì)算機(jī)能夠正確“聽(tīng)懂”人話,NLG則是要計(jì)算機(jī)準(zhǔn)確“說(shuō)出”人話,所以這也可以看作是一個(gè)典型的IPO(Input Process Output)模型。
1、研究方向
句法語(yǔ)義分析。對(duì)于給定的句子,進(jìn)行分詞、詞性標(biāo)記、命名實(shí)體識(shí)別和鏈接、句法分析、語(yǔ)義角色識(shí)別和多義詞消歧。
語(yǔ)音識(shí)別。輸入一段語(yǔ)音,轉(zhuǎn)換成特定的文字。
信息檢索。從大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)(通常是文本)的集合中找出滿足用戶信息需求的資料。
文本挖掘。通過(guò)把語(yǔ)音信號(hào)轉(zhuǎn)換成文本信息,利用詞/句法相關(guān)理論知識(shí),對(duì)其做分類,信息抽取,摘要提取,進(jìn)而達(dá)到輿情分析,情感傾向分析等目的。這部分應(yīng)用主要依賴于基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)。
(16).jpg)
2、應(yīng)用場(chǎng)景
智能對(duì)話系統(tǒng)。這是NLP較高層次的應(yīng)用,也是NLP需要突破的瓶頸之一?,F(xiàn)在市面上見(jiàn)到的智能對(duì)話系統(tǒng)大多基于“sequence-to-sequence”框架,理論上,給足了訓(xùn)練集的話,是可以應(yīng)對(duì)不同的對(duì)話場(chǎng)景,但實(shí)際上是不太現(xiàn)實(shí)的。所以在沒(méi)有被突破之前,智能對(duì)話系統(tǒng)只能在限定的場(chǎng)景下發(fā)揮其作用。代表廠商如:微軟小冰,其次是各大電商平臺(tái)推出的智能客服系統(tǒng);
機(jī)器翻譯。這是NLP領(lǐng)域很常見(jiàn)的應(yīng)用之一,隨著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,機(jī)器翻譯方面取得了較為矚目的成就。代表廠商如:Google翻譯,有道詞典,Bing詞典等翻譯類的SaaS平臺(tái);
輸入法/搜索引擎。綜合了語(yǔ)音識(shí)別,文本挖掘,信息檢索等多項(xiàng)技術(shù)。代表廠商如:百度搜索,Bing,搜索輸入法等。
3、學(xué)習(xí)方法
書(shū)籍。筆者根據(jù)網(wǎng)上查閱的資料整理出了自然語(yǔ)言處理的TOP 5書(shū)籍榜單,并且分成了中英兩種語(yǔ)言的榜單,英文版的書(shū)籍也都有對(duì)應(yīng)的中文譯作。如下圖所示:
視頻。對(duì)于英語(yǔ)基礎(chǔ)好的讀者,先選的學(xué)習(xí)陣地當(dāng)屬Stanford、Coursera,這兩個(gè)地方的視頻課程在業(yè)界是非常權(quán)威的,關(guān)注小象公眾號(hào),回復(fù) 課程鏈接 即可得到視頻鏈接地址。當(dāng)然,國(guó)內(nèi)也相繼出現(xiàn)了一批視頻教程,有好有壞,就不具體列舉了。
網(wǎng)站。先關(guān)注兩個(gè)機(jī)構(gòu):中國(guó)中文信息學(xué)會(huì)、國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì),這里面有你想要的論文,而且絕大多數(shù)是免費(fèi)的;國(guó)內(nèi)做的不錯(cuò)的網(wǎng)站是我愛(ài)自然語(yǔ)言處理(www.52nlp.cn),可以認(rèn)為是一個(gè)NLP領(lǐng)域的Portal,站長(zhǎng)還貼心地鏈接了一個(gè)專門針對(duì)NLPers的垂直招聘網(wǎng)站(www.nlpjob.com);因?yàn)楣ご笮畔z索研究中心算是國(guó)內(nèi)NLP領(lǐng)域的佼佼者,其推出的語(yǔ)言云:LTP-Cloud還是有必要了解一下的。以上資料對(duì)于初學(xué)者來(lái)說(shuō)已經(jīng)非常充裕了,考慮到面向的是國(guó)內(nèi)讀者,我不再推薦外文網(wǎng)站了。
4、市場(chǎng)前景
說(shuō)話可謂是人類很原始的本能之一,倘若能和一臺(tái)機(jī)器自由的交流,表達(dá)自己的想法和心聲而不受到任何阻礙,想必這將是自然語(yǔ)言處理的又一個(gè)新境界,更使得「人工智能」這個(gè)詞匯更具有溫度。正如電影《她》中展現(xiàn)的那樣:
脫去科技冰冷的面紗,賦予它高度人性化和活色生香的情趣,讓一段人機(jī)對(duì)話變成情人絮語(yǔ)。
然而,NLP正在向99%大關(guān)挺進(jìn),今后的路途會(huì)比較艱苦卓絕,所以NLP依然是機(jī)器學(xué)習(xí)有待攻克的一個(gè)重大領(lǐng)域。語(yǔ)言本身就已經(jīng)是人類一種高層次的表達(dá)方式,深度學(xué)習(xí)在NLP領(lǐng)域中取得的成績(jī)并不如在計(jì)算機(jī)視覺(jué)領(lǐng)域那樣突出,識(shí)別率增速遲緩,識(shí)別速度倒是慢了許多,所以一般的素人進(jìn)入這個(gè)領(lǐng)域很難出成果,也容易觸碰到天花板。
不過(guò),NLP也有一定程度的商業(yè)化,各大廠商推出的AI云平臺(tái)多少都涉及到了NLP領(lǐng)域。國(guó)內(nèi)的NLP人才大多都流向了大企,薪資待遇自然是不得而知了。
二、量化交易
量化交易是指借助現(xiàn)代統(tǒng)計(jì)學(xué)和數(shù)學(xué)的方法,利用計(jì)算機(jī)技術(shù)來(lái)進(jìn)行交易的證券投資方式。量化交易從龐大的歷史數(shù)據(jù)中海選能帶來(lái)超額收益的多種“大概率”事件以制定策略,用數(shù)量模型驗(yàn)證及固化這些規(guī)律和策略,然后嚴(yán)格執(zhí)行已固化的策略來(lái)指導(dǎo)投資,以求獲得可以持續(xù)的、穩(wěn)定且高于平均收益的超額回報(bào)。
》》點(diǎn)擊進(jìn)入學(xué)習(xí)量化交易策略長(zhǎng)久更新班(AQF實(shí)訓(xùn)項(xiàng)目+策略大講堂策略集錦)
量化交易是基于量化分析的交易策略,它依賴于數(shù)學(xué)計(jì)算和數(shù)值分析來(lái)確定交易時(shí)機(jī)。量化交易通常是一些金融機(jī)構(gòu)和對(duì)沖基金在使用,交易規(guī)模都會(huì)非常大,可能涉及購(gòu)買和出售數(shù)十萬(wàn)股股票和其他證券。
因此,AQF量化交易無(wú)非就是用“高科技”手段加持過(guò)的投資方法,以便在交易過(guò)程中盡可能保證準(zhǔn)確,避免個(gè)人情感的帶入而做出非理性的決定,引起不必要的風(fēng)險(xiǎn)。
1、研究方向
策略研發(fā)。簡(jiǎn)單來(lái)講,就是參照以往的數(shù)據(jù)和經(jīng)驗(yàn),制定一套新的交易策略。
交易程序化。就是用軟件程序?qū)崿F(xiàn)各個(gè)交易策略,這也是量化交易與人工智能交叉的地方。
資金管理與風(fēng)控。各個(gè)市場(chǎng)及品種的投資資金分配,在運(yùn)用計(jì)算機(jī)進(jìn)行風(fēng)險(xiǎn)監(jiān)控的同時(shí),進(jìn)行人工輔助監(jiān)控。
2、應(yīng)用場(chǎng)景
各大券商,交易所都有應(yīng)用,這里不詳細(xì)說(shuō)明應(yīng)用場(chǎng)景了,列舉一些量化平臺(tái),感受一下:
Quantopian,這個(gè)平臺(tái)堪稱業(yè)界典范,也是國(guó)人競(jìng)相模仿的一個(gè)量化平臺(tái)。
優(yōu)礦,米筐和聚寬,算是國(guó)內(nèi)量化先行者,相對(duì)比較完善,模仿的是Quantopian。
JD Quant,京東金融旗下的量化平臺(tái)。主營(yíng)業(yè)務(wù)是對(duì)量化策略的在線開(kāi)發(fā),并實(shí)施運(yùn)營(yíng)回測(cè),主要還是依托了京東強(qiáng)大的資源整合能力,能提供海量的數(shù)據(jù)和強(qiáng)大的服務(wù)支持。
3、學(xué)習(xí)方法
書(shū)籍。因?yàn)榱炕顿Y在國(guó)內(nèi)起步很晚,書(shū)籍基本都是出自美國(guó)作家之手,這里列舉TOP 5書(shū)籍榜單,此榜單可以認(rèn)為是量化交易的金融基礎(chǔ)知識(shí),至于軟件程序方面,都是機(jī)器學(xué)習(xí)和大數(shù)據(jù)相關(guān)的通用技能,故不再列舉。
視頻。量化交易的視頻資料并不多,筆者淘到了一些資料。來(lái)自廈門大學(xué)金融工程基礎(chǔ)知識(shí)視頻,關(guān)注小象公眾號(hào),回復(fù) 課程鏈接 即可得到視頻鏈接地址;米筐出品的一系列教程,沒(méi)看過(guò),目測(cè)有硬廣的嫌疑。
4、市場(chǎng)前景
量化交易是未來(lái)金融投資的趨勢(shì),國(guó)外的量化普及程度算是比較高了,在國(guó)內(nèi),量化概念還僅僅是一部分人了解,不過(guò)國(guó)內(nèi)也已經(jīng)有一些量化交易先行者了,在上文中也所有提及。盡管如此,量化交易領(lǐng)域也并不是一片紅海,國(guó)內(nèi)外也暫未形成一家獨(dú)大的壟斷局勢(shì),正在激烈角逐的階段。
金融行業(yè)華麗高端的外表下掩藏著一群交易員的辛酸與悲歡,在量化交易領(lǐng)域,不僅需要懂得專業(yè)的金融知識(shí),制定交易策略,還需要對(duì)計(jì)算機(jī)編程有所了解,甚至是用編程語(yǔ)言實(shí)現(xiàn)一個(gè)交易策略,專業(yè)交易員是時(shí)候用量化武器武裝自己了。
當(dāng)前局勢(shì)下,對(duì)于經(jīng)管專業(yè)的人來(lái)說(shuō),進(jìn)入量化投資領(lǐng)域無(wú)疑是明智的,各大廠商招聘的起薪通常在15K左右,也有高過(guò)20K的。
.jpg)




