0
| 本文作者: 叨叨 | 2017-08-05 19:27 |
雷鋒網(wǎng)按:8 月 5 日,在 Rebuild 2017 大會(huì)上,智融集團(tuán) CEO 焦可發(fā)表了題為《智能如何重新定義金融的邊界》,分享了傳統(tǒng)金融機(jī)構(gòu)業(yè)務(wù)與智能金融的差異,并講述了智能是如何解決傳統(tǒng)金融不平等的問題。雷鋒網(wǎng)根據(jù)現(xiàn)場速記進(jìn)行了整理。

以下是智融集團(tuán)創(chuàng)始人焦可的演講實(shí)錄,雷鋒網(wǎng)在不改變原意的基礎(chǔ)上做了精編:
《智能如何重新定義金融的邊界》,看到這個(gè)標(biāo)題的時(shí)候,我想最抓眼球的,一定是“智能”這兩個(gè)字。人工智能在最近的這段時(shí)間已經(jīng)成為大家不可忽視的一個(gè)話題,從餐館的服務(wù)員、到出租車司機(jī),每個(gè)人都能聊兩句人工智能相關(guān)的東西。借用李開復(fù)老師的一句話來講,他覺得人工智能已經(jīng)從一個(gè)科學(xué)、科技變成一種科幻,我們希望它不要變成魔幻。
所以,真正吸引我們的是什么呢?首先,只有智能我覺得是不夠的。智能就像一把錘子,我們不能舉著一個(gè)錘子滿世界去找釘子。那么釘子是什么?釘子就是金融的邊界。
我先介紹一下,在我們眼里傳統(tǒng)金融的邊界在哪里?

我們真正找到金融的邊界花了很多成本,這張圖,其實(shí)就是一個(gè)實(shí)際的現(xiàn)狀。在中國,只有15%左右的人,能夠被傳統(tǒng)金融機(jī)構(gòu)所服務(wù)。但是在歐美,實(shí)際上有70%的人可以被傳統(tǒng)金融機(jī)構(gòu)所服務(wù)。
這也回答了剛才金證濟(jì)蒼(Video++創(chuàng)始人&CEO)提到的問題,為什么在以色列 IMVC 機(jī)器視覺大會(huì)上,如果有1000萬美元會(huì)投哪個(gè)AI應(yīng)用領(lǐng)域,1600位 AI 的科學(xué)家沒有把票投給金融和安防,因?yàn)閷τ跉W美這些發(fā)達(dá)的國家來講,這可能已經(jīng)不是一個(gè)太大的問題。
所以,我們跟很多美國的信貸公司交流的時(shí)候,他們其實(shí)非常羨慕我們,因?yàn)橛X得中國有一個(gè)巨大的市場機(jī)會(huì)。中國的傳統(tǒng)供給是不夠的,所以這才給新技術(shù)有了發(fā)揮的空間。
就像在過去幾年看到的手機(jī)支付,在中國其實(shí)遠(yuǎn)遠(yuǎn)超過了美國。就是因?yàn)樵诿绹ㄖЦ兑呀?jīng)是一個(gè)非常普遍的手段,留給這些新技術(shù)的空間非常小。但是在中國,我們看到的是一個(gè)巨大的沒有被滿足需求的市場。
我們剛剛看到了金融的邊界,接著深入想一個(gè)問題——金融的邊界為什么在這里,為什么傳統(tǒng)金融沒有為剩下的巨大市場服務(wù)?

這在我們看來其實(shí)是一個(gè)傳統(tǒng)金融機(jī)構(gòu)的審美問題。我不知道大家有沒有去銀行辦過信用卡,或者辦過貸款,銀行基本上都會(huì)要求大家提供一些材料,比如說提供你的征信報(bào)告、社保、工資證明、工作證明,提供各種各樣的抵押品、資產(chǎn)證明等。但是,當(dāng)你不符合它的審美的時(shí)候,往往你就會(huì)被拒掉。
我們知道,中國是一個(gè)數(shù)據(jù)建設(shè)并沒有那么完善的國家,我們看到有很多年輕人實(shí)際上是沒有征信記錄的,有很多私人企業(yè)里,發(fā)工資的方式是用現(xiàn)金,很多人是沒有社保的,很多人也沒有車、房這樣的資產(chǎn)。這些人,就不符合傳統(tǒng)金融機(jī)構(gòu)的審美。
在我們看來,傳統(tǒng)金融機(jī)構(gòu)就像是數(shù)據(jù)冰山水面上的部分,好處是看得很清楚。但是,壞處是它只能代表個(gè)人數(shù)據(jù)非常小的一部分。
我們的一個(gè)觀點(diǎn)是,如果能利用好水面之下的數(shù)據(jù),能夠去看到這個(gè)人更多的信息,那么我們就能發(fā)明一種新的審美,而這種審美是不同于傳統(tǒng)金融機(jī)構(gòu)審美的。
傳統(tǒng)金融機(jī)構(gòu),我們經(jīng)常做一個(gè)比喻,像什么呢?像是一個(gè)篩子,它用了幾條規(guī)則,去把這一堆蘋果里面的大蘋果篩出來。而漏掉的蘋果里,一定有一些好的蘋果,但是他們是沒有辦法判斷這個(gè)蘋果是好是壞,我們在做的事情,是發(fā)明一桿秤,去真正的測量這個(gè)蘋果是好是壞。
所以,我們現(xiàn)在可以做到,單月信貸業(yè)務(wù)量已經(jīng)突破150萬筆。這個(gè)數(shù)字其實(shí)對于傳統(tǒng)金融機(jī)構(gòu)來講是個(gè)天文數(shù)字,因?yàn)橐粋€(gè)銀行網(wǎng)點(diǎn)一般一個(gè)月的信貸業(yè)務(wù)量可能也只有幾百筆、幾千筆,150萬筆對傳統(tǒng)金融機(jī)構(gòu)來講是一個(gè)不可能的數(shù)據(jù)。
但是,這150萬筆背后還有一些更神奇的數(shù)字,我們現(xiàn)在做一筆信貸業(yè)務(wù)只需要通過8秒的時(shí)間。全程是沒有任何人工介入的,每天7×24小時(shí)的工作。
我們公司里沒有傳統(tǒng)金融機(jī)構(gòu)的人,沒有一些“老司機(jī)”告訴我們什么是好用戶、什么是壞用戶。
先舉一個(gè)很好理解的例子。這是 Google 在做的一個(gè)項(xiàng)目,如何在一堆動(dòng)物圖片里面找到貓和非貓,如果我們按照傳統(tǒng)的方法,可以寫一個(gè)規(guī)則引擎,可以寫幾條規(guī)則。
比如說,如果這張圖片的物體里面有毛的紋理,如果這個(gè)輪廓上面有尖的耳朵,如果有尾巴,如果這個(gè)東西有胡子,你可以判斷這是一只貓。但是實(shí)際上你會(huì)發(fā)現(xiàn),這樣首先會(huì)引入很多錯(cuò)誤,有時(shí)候你會(huì)把狐貍找出來了,如果這只貓是只折耳貓或者是無毛貓,或者是它在圖片里面把貓的尾巴隱藏起來了,這只貓你就會(huì)錯(cuò)過。

但是 Google 是怎么做的?Google 實(shí)際上并沒有找動(dòng)物專家去判斷、定規(guī)則什么是貓,Google 的做法是把一大堆圖片里哪些是貓、哪些不是貓標(biāo)注出來,扔給模型,讓模型自己去找到它的特征,讓模型自己去發(fā)現(xiàn)規(guī)律,這個(gè)時(shí)候你發(fā)現(xiàn)它的準(zhǔn)確度和召回率都要遠(yuǎn)遠(yuǎn)高于人的能力。
我們在做的事情跟這個(gè)有很類似之處,我們在做的事情也是在一堆這樣的用戶里面去找到哪些是貓,哪些是非貓,哪些人是我們傳統(tǒng)意義上會(huì)還錢的用戶,哪些人誠信是有問題的。

而這些事情不是像傳統(tǒng)金融機(jī)構(gòu)一樣寫一個(gè)規(guī)則引擎,我們不是這么做的。規(guī)則引擎是什么?就像我們談到的,傳統(tǒng)的金融是怎么判斷你的風(fēng)險(xiǎn)的呢?是做一堆規(guī)則,如果你的工資大于多少,并且你有社保,以及你的征信報(bào)告是怎么樣的,然后你是可以通過的,或者你就被拒掉了。這是傳統(tǒng)金融的規(guī)則引擎。
但是在我們看來,這種規(guī)則引擎跟剛才那個(gè)貓的例子是一樣的,總是受到人的局限。特別是在人無法進(jìn)行判斷的業(yè)務(wù)領(lǐng)域里面,局限就越發(fā)明顯。
而我們在做的事情就是我們把一大堆人的特征扔到模型里邊,讓模型告訴我們什么是好的用戶,什么是壞的用戶。
我們最核心的一個(gè)技術(shù)就是 I.C.E.
I.C.E. 實(shí)際上是三個(gè)英文單詞首字母的縮寫,就是 Identification、Calculation、Evaluation,這三個(gè)環(huán)節(jié)其實(shí)也是很多人工智能領(lǐng)域里,都會(huì)碰到的。

第一,辨識(shí),找到這個(gè)事件、業(yè)務(wù)里的特征。比如對于智能駕駛,就要找到識(shí)別路上的物體都是什么東西;第二,計(jì)算要處理大量的人工無法處理的特征,這個(gè)時(shí)候要有充分的計(jì)算能力;第三,決策、評估,究竟該左轉(zhuǎn)、右轉(zhuǎn)、踩剎車還是油門。
這是人工智能的三個(gè)環(huán)節(jié),在金融領(lǐng)域里面,同樣有這樣的三個(gè)環(huán)節(jié):
第一,柯南特征工程

從大量的數(shù)據(jù)里面找到那些真正跟客戶逾期率相關(guān)的特征。
對于傳統(tǒng)金融來講,他們看到的特征可能是那幾項(xiàng)、十幾項(xiàng)特征,但是對于我們來講,我們看到的是一個(gè)用戶1200個(gè)以上特征,而這個(gè)特征是跟逾期率相關(guān)的,我們看過的特征也遠(yuǎn)比這個(gè)數(shù)據(jù)要多很多,我們看過各種各樣奇奇怪怪的特征。比如說我們之前也試過說星座會(huì)不會(huì)跟逾期相關(guān),處女座會(huì)不會(huì)愛還錢?其實(shí)沒有。
但是你發(fā)現(xiàn)有很多更奇怪的特征是跟客戶相關(guān)的。比如說我們會(huì)看到用戶在使用的時(shí)候,輸入身份證號(hào)的節(jié)奏會(huì)不一樣,而這種節(jié)奏跟客戶的逾期率相關(guān)。我舉的這個(gè)例子相對大家不太好理解,但是你發(fā)現(xiàn)有更多的特征,實(shí)際上是非結(jié)構(gòu)的數(shù)據(jù),是一種人類無法解釋的數(shù)據(jù)。就像 AlphaGo 一樣,如果用規(guī)則引擎來寫這樣的規(guī)則,你知道他為什么會(huì)下這步棋,但是 AlphaGo 為什么會(huì)下這步棋,你實(shí)際上是不知道的。
我們在特征領(lǐng)域可以發(fā)覺到遠(yuǎn)遠(yuǎn)比人的經(jīng)驗(yàn)更深入的一些特征,而且絕大多數(shù)的特征都是人的計(jì)算力無法去計(jì)算的。有了這些特征之后,為什么我們能夠知道這些特征是跟逾期率相關(guān)的?是有賴于我們接下來的模塊。
第二,D-AI機(jī)器學(xué)習(xí)模型

我剛才談到不依賴傳統(tǒng)的金融專家告訴我們什么是好的、什么是壞的,為什么?
回到我們最開始的數(shù)字,我們單月的業(yè)務(wù)量已經(jīng)突破了150萬筆,而這150萬筆意味著什么?意味著每天就有5-6萬的用戶在使用我們的信貸服務(wù)。這5-6萬個(gè)用戶下個(gè)月實(shí)際的表現(xiàn)就會(huì)告訴我們,他是一個(gè)好用戶還是壞用戶,相對而言,跟人的經(jīng)驗(yàn)比起來,我們更相信的是實(shí)際的數(shù)據(jù)。
這個(gè)很類似于剛才那個(gè)貓,甚至比那個(gè)貓的意思更好一點(diǎn),根本就不需要雇人標(biāo)什么是貓、什么不是貓,用戶實(shí)際上會(huì)用行為告訴我們。
當(dāng)這5-6萬用戶每天回來的時(shí)候,大概計(jì)算一下,5-6萬的用戶加上每個(gè)用戶有1200個(gè)特征點(diǎn),所以你每天處理的特征點(diǎn)數(shù)是幾千萬的數(shù)量,而這個(gè)時(shí)候可以充分地告訴我們什么是好用戶,什么是壞用戶。
就像一個(gè)傳統(tǒng)的風(fēng)控人員,他的風(fēng)控也是來自于對一些案例的學(xué)習(xí),可能今年放了幾百筆,明年看看這幾百筆的效果。但是他的量級(jí)和速度是遠(yuǎn)遠(yuǎn)跟不上機(jī)器。
所以,我們現(xiàn)在每個(gè)月機(jī)器學(xué)習(xí)的次數(shù)其實(shí)是上百次,這個(gè)跟傳統(tǒng)金融是不一樣的,傳統(tǒng)金融可能半年、一年會(huì)迭代一次模型,但是我們每個(gè)月、每天模型都在發(fā)生大量的變化。
而我們線上在跑的模型也不是一個(gè),實(shí)際上每天線上放出幾萬筆貸款的時(shí)候,背后的模型是有幾百個(gè)模型。這是跟傳統(tǒng)金融很不一樣的地方。
第三,Anubis 大數(shù)據(jù)計(jì)算架構(gòu)

為了支撐這么大的計(jì)算量,我們搭了一個(gè)大數(shù)據(jù)計(jì)算的架構(gòu),每天處理的數(shù)據(jù)量已經(jīng)超過了5T。特征進(jìn)行全量樣本的迭代速度,其實(shí)只需要15分鐘,真正進(jìn)行線上的審核是8秒鐘。所以這一切對傳統(tǒng)金融來講都是新的變革。
從實(shí)際的案例里面看到,用人工智能技術(shù)去解決金融的需求,確實(shí)是一個(gè)很有意思的話題,我們發(fā)現(xiàn)金融天然就是跟數(shù)字打交道的,所以在這里會(huì)有很多數(shù)據(jù)產(chǎn)生,而金融天然又是正負(fù)樣本非常清楚的業(yè)務(wù),還或者是不還,股票的漲跌,保險(xiǎn)賠還是不能賠,這都是被實(shí)際迭代出來的樣本、學(xué)習(xí)的對象。
我們發(fā)現(xiàn)機(jī)器會(huì)比人更加擅長處理大量數(shù)據(jù)的定量計(jì)算,人比較適合做的是定性的,可以就可以,不行就拒掉,機(jī)器比人的學(xué)習(xí)速度要快很多,而且機(jī)器沒有偏見,機(jī)器不會(huì)疲勞,機(jī)器沒有道德風(fēng)險(xiǎn),我們不用擔(dān)心說像傳統(tǒng)金融領(lǐng)域一樣有很多從業(yè)者去做欺詐,我們機(jī)器是沒有可欺詐的部分。
當(dāng)你使用大量的特征點(diǎn)的時(shí)候,也會(huì)發(fā)現(xiàn)欺詐的用戶根本就無從下手,他不知道你是怎么建立這個(gè)模型的,如果你是一個(gè)規(guī)則引擎的話,就容易被人攻破。
但我們發(fā)現(xiàn)傳統(tǒng)金融產(chǎn)生資產(chǎn)的方式,傳統(tǒng)金融進(jìn)行風(fēng)控方式還是停留在原來的規(guī)則引擎,還是在用傳統(tǒng)的專家經(jīng)驗(yàn)去找到什么是貓,什么不是貓。
我們認(rèn)為互聯(lián)網(wǎng)金融正在進(jìn)入下半場的革命,下半場真正最核心的就是內(nèi)在技術(shù)(引擎革命)。
傳統(tǒng)金融實(shí)際上是一種燃燒不充分的金融,傳統(tǒng)的金融引擎燒的是什么呢?燒的是專家的經(jīng)驗(yàn)、人力。我們認(rèn)為新的金融模式應(yīng)該不是這樣的,新能源下的金融模式引擎燒的是數(shù)據(jù)、算法、工程師,這是新的引擎,真正的價(jià)值來自于新的引擎。
傳統(tǒng)金融之所以使用這樣的引擎,受到了傳統(tǒng)的局限,你發(fā)現(xiàn)傳統(tǒng)金融在開展業(yè)務(wù)的時(shí)候,它往往是基于一個(gè)產(chǎn)品為中心的模式,它是先定義一些產(chǎn)品。比如說白領(lǐng)貸、工薪貸、車抵貸、企業(yè)貸,往往先定義一個(gè)產(chǎn)品,然后定義規(guī)則,然后根據(jù)規(guī)則找到人。這就很像我們先生產(chǎn)出一批35號(hào)和40號(hào)的鞋,去找到適合這個(gè)鞋的腳,這個(gè)模式其實(shí)是有問題的,因?yàn)橛袝r(shí)候你的腳比較小的時(shí)候,穿這個(gè)鞋很不舒服,如果你的腳比較大的時(shí)候,就要削足適履,這是傳統(tǒng)的金融。
那么我們期望在新金融模式下,能夠做到先找到人,通過技術(shù)評估一個(gè)人,通過 I.C.E 判斷一個(gè)人的風(fēng)險(xiǎn),然后為他提供適合他的金融產(chǎn)品以及金融能力。
傳統(tǒng)的金融是一個(gè)少數(shù)人的金融,如果想改變這樣的問題,改變這樣的不平等,需要的是一個(gè)更加有智慧的金融。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。