0
| 本文作者: 吳京鴻 | 2019-05-10 11:28 |

【大咖Live】淘金者科技專場(chǎng),淘金者科技集團(tuán)首席科學(xué)家許意華先生帶來(lái)了關(guān)于“AI在金融服務(wù)業(yè)的應(yīng)用”的主題分享。目前,本期分享音頻及全文實(shí)錄已上線,「AI投研邦」會(huì)員可進(jìn)「AI投研邦」頁(yè)面免費(fèi)查看。
本文對(duì)本次分享進(jìn)行部分要點(diǎn)總結(jié)及PPT整理,以幫助大家提前清晰地了解本場(chǎng)分享重點(diǎn)。
分享提綱
AI+金融為什么這么熱?
AI核心算法簡(jiǎn)介
淘金者科技集團(tuán)金融科技戰(zhàn)略
牛小量--牛股王APP智能診股
牛股王smartbeta情緒指數(shù)
期貨淘金者APP機(jī)器學(xué)習(xí)策略
淘金者科技盈寬量化平臺(tái)
淘金者科技AI應(yīng)用展望
以下為淘金者科技集團(tuán)首席科學(xué)家許意華先生的實(shí)錄摘取,【AI投研邦】在不改變?cè)獾幕A(chǔ)上做了整理和精編。完整分享內(nèi)容請(qǐng)關(guān)注【AI投研邦】會(huì)員內(nèi)容。
大家晚上好,我是淘金者科技集團(tuán)首席科學(xué)家許意華。然后非常感謝大家抽出寶貴的時(shí)間來(lái)參與「AI投研邦」此次的直播。今天我想跟大家一起分享的主題是《AI在金融服務(wù)業(yè)的應(yīng)用》。

然后因?yàn)榻裉煳覀冎v的主題是什么?是AI+金融,所以我可能有點(diǎn)偏理工男的一個(gè)角度來(lái)說(shuō),到底什么是金融?可以說(shuō)金融是在時(shí)間和風(fēng)險(xiǎn)雙維度下,對(duì)現(xiàn)有的資源進(jìn)行當(dāng)前未來(lái)消費(fèi)的一個(gè)或者說(shuō)均衡決策,以實(shí)踐整體上效應(yīng)的最大化。
AI能夠解決金融領(lǐng)域的什么的一些問(wèn)題,他們解決什么痛點(diǎn)?其實(shí)在大數(shù)據(jù)時(shí)代,傳統(tǒng)金融面臨著升級(jí)轉(zhuǎn)型,目前來(lái)看金融行業(yè)面臨一些比較明顯的痛點(diǎn),一個(gè)是各種數(shù)據(jù)是越來(lái)越多,包括結(jié)構(gòu)性結(jié)構(gòu)化的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,海量的數(shù)據(jù)。 然后比如說(shuō)交易來(lái)說(shuō),行情也是越來(lái)越快,然后靠人腦很難以長(zhǎng)時(shí)間高效率的來(lái)分析解讀這些數(shù)據(jù),或者是來(lái)做決策。然后還有一個(gè)就是市場(chǎng)是越來(lái)越完善,信息不對(duì)稱正在消失。我們舉個(gè)交易的例子來(lái)說(shuō),簡(jiǎn)單的交易策略可能是很難生效了,很難挖掘潛在的交易機(jī)會(huì)??赡蹵I是一個(gè)深度挖掘數(shù)據(jù)的一個(gè)好方法,可以解決這方面的一個(gè)需求。還有一方面可能人會(huì)比較疲倦,會(huì)受各種情緒的影響。然后可能在比如說(shuō)交易方面,可能他的交易出來(lái)的一個(gè)紀(jì)律性就不好,大家可能如果交易期貨的話,往往會(huì)受到情緒的影響。
但是AI算法如果用來(lái)做交易,可能就不存在這些弱點(diǎn),之后也不會(huì)受到人的情緒的影響,可能會(huì)更加穩(wěn),特別是相關(guān)的一些智能風(fēng)控系統(tǒng),可以幫助到咱們的投資者。
另外一個(gè)還有一個(gè)就是從勞動(dòng)力成本上考慮。比如說(shuō)現(xiàn)在很多金融企業(yè)可能有大量的銷(xiāo)售,有大量的客服,現(xiàn)在的成本其實(shí)挺高的。如果說(shuō)金融科技可以在這方面幫助的話,我想可能主要是一個(gè)是客服方面,可以通過(guò)機(jī)器人的客服來(lái)解決很大一部分的問(wèn)題。還有一些智能化的一些市場(chǎng)運(yùn)營(yíng),或者說(shuō)市場(chǎng)推廣,可能人工智能在這方面能夠幫到咱們金融科技企業(yè),上面是我們剛剛所說(shuō)的金融領(lǐng)域里面面臨的一些痛點(diǎn)這些痛點(diǎn)正好是AI的優(yōu)勢(shì)所在。
人工智能它是可以以大數(shù)據(jù)為基礎(chǔ),非常適合什么,特別是在金融市場(chǎng),這樣的數(shù)據(jù)量龐大,特征維度又高又快,然后相互關(guān)聯(lián)又非常復(fù)雜的環(huán)境里,能夠起到很好的一個(gè)作用。人工智能在處理大數(shù)據(jù)深度挖掘數(shù)據(jù)能力,可復(fù)制高穩(wěn)定方面有優(yōu)勢(shì),所以我們認(rèn)為潛在來(lái)說(shuō)可以在金融領(lǐng)域大展拳腳。如果以量化交易為例,我們發(fā)現(xiàn)就是說(shuō)最近特別是近近年來(lái)很多量化基金的出現(xiàn),很多智能投顧的出現(xiàn),也證明了AI的一個(gè)熱度。這張圖列出了是金融科技在金融各個(gè)領(lǐng)域的應(yīng)用。
我特別地是把人工智能在證券基金以及消費(fèi)金融領(lǐng)域,行業(yè)的應(yīng)用場(chǎng)景給列出來(lái),框出來(lái)。大家可以看到有智能投顧,有量化交易,有智能風(fēng)控,有營(yíng)銷(xiāo)客戶的。我把它框出來(lái),原因是因?yàn)樵谔越鹫呖萍技瘓F(tuán),我們正是在這幾個(gè)領(lǐng)域利用了AI剛才我提到了說(shuō)AI很熱,然后我們也知道AI正是金融科技的一個(gè)重要技術(shù)支撐。
AI核心算法簡(jiǎn)介

我會(huì)接下來(lái)列舉一下目前市場(chǎng)上,或者說(shuō)在這個(gè)圈子金融應(yīng)用里面比較流行的或者主流的一些算法,然后嘗試介紹其中幾個(gè)具有代表意義的。這里列出的是一些比較常見(jiàn)的AI算法,我們可以看到有決策樹(shù)、隨基森林,然后看到有SVM,邏輯回歸,有樸素的貝葉斯網(wǎng)絡(luò),還有K最近鄰也叫K臨近算法,然后還有卡爾曼濾波、Adaboost,還有神經(jīng)網(wǎng)絡(luò)、馬爾可夫。這些算法其實(shí)都是比較常見(jiàn)的,大家可能隨便找一本關(guān)于機(jī)器學(xué)習(xí)或者是人工智能算法的書(shū)里面都會(huì)介紹。
然后比如說(shuō)決策樹(shù)算法,它就是機(jī)器學(xué)習(xí)的一種,它主要是用來(lái)解決一些分類(lèi)問(wèn)題,我們或者說(shuō)叫做回歸問(wèn)題。我以前在網(wǎng)上看到一個(gè)簡(jiǎn)單例子,就是比較好的描述。這個(gè)例子是這樣說(shuō)的,說(shuō)是小紅的媽媽安排她相親,然后見(jiàn)了介紹了小紅就問(wèn)帥嗎?有房嗎?收入怎么樣呢?問(wèn)的各種問(wèn)題,其實(shí)就涉及到了一個(gè)樣本的屬性。然后小紅就不斷地利用樣本的屬性值來(lái)不斷的調(diào)整自己的判斷,最后一步步達(dá)到最后一個(gè)最終的一個(gè)展示,我要去了,我要想去見(jiàn)這個(gè)男士。這個(gè)就是非常形象的描述了一個(gè)角色樹(shù)的一個(gè)算法邏輯。


然后我們?cè)倏匆幌?,KNN則是一個(gè)什么?這是一個(gè)計(jì)算距離的一種分類(lèi)算法。他這里考慮的問(wèn)題是怎樣對(duì)樣本數(shù)據(jù)進(jìn)行快速的搜索,或者我們叫K臨近搜索。這里的K只是特征向量的維度,我們可能聽(tīng)起來(lái)比較難以明白,我們可以簡(jiǎn)單的舉個(gè)交易的例子。
比如說(shuō)我手上有K線的數(shù)據(jù),然后我還把這K線分為各種形態(tài),比如說(shuō)什么設(shè)計(jì)之星,類(lèi)似于這樣的一些,或者是錘子之類(lèi)的,或者是各種各樣的形態(tài)。有些柱體比較短,有的兩頭比較長(zhǎng),或者是相反。如果拿新的一個(gè)K線,任務(wù)是判斷它到底屬于哪一類(lèi),那可以幫助解決這個(gè)問(wèn)題,它基本上是一個(gè)分類(lèi)器。然后我們還看到底下介紹了一個(gè)叫Adaboost,它是一種迭代算法,其實(shí)就是針對(duì)一個(gè)訓(xùn)練集,這些分類(lèi)器可能各自可能出來(lái)的效果并不是特別好。然后我們學(xué)我們一般把它稱為弱分類(lèi)器,但是他的思想是如果把這些弱的分類(lèi)器組合起來(lái),通過(guò)一些算子結(jié)合在一起,可能加減乘除可能之類(lèi)的,最后夠可以構(gòu)成一個(gè)更強(qiáng)的強(qiáng)分類(lèi)器。這個(gè)可能用句形象的術(shù)語(yǔ)比較說(shuō)話,我們就老話說(shuō)了,叫三個(gè)臭皮匠頂上個(gè)諸葛亮,大概用比較好地描述了這樣一個(gè)邏輯思想。
應(yīng)用案例1:牛小量-牛股王APP智能診股
淘金者科技集團(tuán),英文名Trademaster Tech,它是一家以金融科技為核心驅(qū)動(dòng)的互聯(lián)網(wǎng)金融服務(wù)商。 到目前為止,業(yè)務(wù)范圍覆蓋了A股的投顧,還有港美股,財(cái)富管理,特別是ESOP等等機(jī)構(gòu)業(yè)務(wù)。
接下來(lái)我介紹三個(gè)淘金者科技集團(tuán)在AI上的應(yīng)用案例,一個(gè)是牛小量,即牛股APP的智能診股。另外一個(gè)是牛股網(wǎng)smartBeta,一個(gè)情緒指數(shù),還有一個(gè)是期貨淘金者的APP機(jī)器學(xué)習(xí)策略,它其實(shí)是一組策略。
牛股王,剛才我們介紹了他是淘金者科技集團(tuán)下一個(gè)服務(wù)于A股或者說(shuō)是證券投顧業(yè)務(wù)的一個(gè)APP。牛小量是它基于AI的智能診股服務(wù)產(chǎn)品,我們有時(shí)候會(huì)把它叫成是一個(gè)子產(chǎn)品或模塊。


這款產(chǎn)品主要是基于我們nlp,也叫語(yǔ)義識(shí)別。然后語(yǔ)音識(shí)別他是AI的一個(gè)重要分支。舉個(gè)例子我們的客戶通過(guò)輸文字,或者是語(yǔ)音方式輸入中國(guó)銀行這支股票明天是什么樣的一個(gè)情況,是升還是跌,或者說(shuō)它的一些基本資料,我們能夠通過(guò)NLP算法,最后輸從數(shù)據(jù)庫(kù)里拿出來(lái)的一些,或者是我們經(jīng)過(guò)組合整理的一些資料提供給我們的客戶,其中也包括一些加工過(guò)的數(shù)據(jù),然后這個(gè)產(chǎn)品其實(shí)還挺受用戶歡迎的。
然后這里說(shuō)的是牛小量整股票邏輯,首先是語(yǔ)義分析處理用戶輸入的信息,然后找到對(duì)應(yīng)的標(biāo)的。從數(shù)據(jù)庫(kù)中,或者是從知識(shí)圖譜中,因?yàn)檫@里用到其實(shí)用到了知識(shí)圖譜的一個(gè)一個(gè)技術(shù),從這個(gè)數(shù)據(jù)庫(kù)中就篩選出該標(biāo)的所有的數(shù)據(jù)信息,這些數(shù)據(jù)信息都是打了標(biāo)簽的,也就是知識(shí)圖譜。然后我們將基本面的行情數(shù)據(jù),然后還有一些非結(jié)構(gòu)化的數(shù)據(jù),輸入進(jìn)神經(jīng)網(wǎng)絡(luò),然后通過(guò)神經(jīng)網(wǎng)絡(luò)的分析,得到該股票的診斷信息,然后自動(dòng)的形成一個(gè)報(bào)告,顯示到用戶的終端。 當(dāng)然我們現(xiàn)在這款產(chǎn)品還處在一個(gè)比較初級(jí)的階段,還在不停的迭代之中,還會(huì)不斷的迭代算法,同時(shí)也提供更好的數(shù)據(jù)輸入。
應(yīng)用案例2:牛股王SmartBeta情緒指數(shù)


為什么會(huì)有什么SmartBeta情緒指數(shù)出來(lái)呢?其實(shí)是這樣的,就是通過(guò)大量的實(shí)證研究,股市的漲跌可能跟投資者的情緒會(huì)有著很大程度的一個(gè)相關(guān)性,甚至是正相關(guān)性。所以如果能夠準(zhǔn)確的跟蹤刻畫(huà),并且數(shù)據(jù)化的方式來(lái)顯示整個(gè)市場(chǎng)投資者的情緒,會(huì)對(duì)投資行為的決策有非常強(qiáng)的指導(dǎo)作用。
然后牛股王正好是一個(gè)散戶的一個(gè)社區(qū),然后有大量的交易型的用戶,他們的情緒可能對(duì)我們的這個(gè)交易可能會(huì)有一些指導(dǎo)作用。所以牛股王SmartBeta情緒指數(shù)也是一款基于AI算法的產(chǎn)品,我們甄選了非常多的影響因子。包括用戶以前有沒(méi)有登陸牛股APP、是否有發(fā)言、還有一些可能我們認(rèn)為是VIP或KOL的一些用戶,他有沒(méi)有發(fā)言?他有沒(méi)有操作其模擬賬戶、停留時(shí)間、他選擇哪些股票做交易、它的交易情況怎么樣等等這一系列的信息,都可能是成為我們的有一定影響力的一些因子。
然后我們其實(shí)上面也介紹過(guò)貝葉斯網(wǎng)絡(luò),我們其實(shí)用貝葉斯網(wǎng)絡(luò)來(lái)做分類(lèi),將每一個(gè)投資者情緒進(jìn)行分類(lèi),然后進(jìn)行標(biāo)簽化,把它標(biāo)注為積極、觀望、消極三個(gè)標(biāo)簽,然后通過(guò)算法,我們可以確定未來(lái)情緒指數(shù)的分?jǐn)?shù)是多少,是一種這樣的一種邏輯。然后再走到情緒標(biāo)簽之后,我們通過(guò)SVM算法將整個(gè)市場(chǎng)的情緒進(jìn)行綜合性分類(lèi),然后打分得到最后的情緒指標(biāo)數(shù)據(jù)。
會(huì)員問(wèn)答
為更深入的解決聽(tīng)眾的困惑,「Live」在分享結(jié)束后開(kāi)設(shè)問(wèn)答環(huán)節(jié),許意華對(duì)雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)))「AI投研邦」會(huì)員部分疑問(wèn)進(jìn)行了解答。
Q1:量化投資軟件會(huì)未來(lái)會(huì)開(kāi)源嗎?有行業(yè)人士說(shuō)商業(yè)軟件和機(jī)構(gòu)自研有安全、兼容、迭代等問(wèn)題。
目前這個(gè)階段還沒(méi)有開(kāi)源,正在發(fā)展階段,未來(lái)我們確實(shí)有計(jì)劃把我們盈寬量化這部分東西,我們也希望開(kāi)源或者是一種接口的方式,跟外部的合作方進(jìn)行深度合作。
Q2:投資者需不需要這么多信息?是不是會(huì)消息過(guò)載?
其實(shí)這個(gè)問(wèn)題問(wèn)得非常好,因?yàn)槲覀儸F(xiàn)在是在這個(gè)大數(shù)據(jù)的時(shí)代,投資者所獲得的信息是海量,所以確實(shí)是有的信息是毫無(wú)價(jià)值,有的信息是非常有價(jià)值,有的信息是隱藏在非常海量的數(shù)據(jù)之中。人工智能算法就是在幫助投資者在分析這些數(shù)據(jù),因?yàn)榭咳肆Φ姆绞狡鋵?shí)是沒(méi)有辦法快速解決的,人工智能潛在來(lái)說(shuō)有這個(gè)優(yōu)勢(shì),他能夠有很好的一個(gè)計(jì)算能力,所以能夠高速的去處理數(shù)據(jù),能夠算法能夠比如說(shuō)可以用一些分類(lèi)算法,分析出哪些哪些是有影響力的因子,特征,數(shù)據(jù),通過(guò)這樣的方式能夠幫助我們?nèi)藖?lái)做決策。
完整內(nèi)容和PPT查看可進(jìn)入「AI投研邦」查看

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。