日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
金融科技 正文
發(fā)私信給AI金融評論
發(fā)送

0

數(shù)據越多模型越復雜越好?這家P2P公司認為關鍵在于“意識”

本文作者: AI金融評論 2018-06-05 19:48
導語:P2P大數(shù)據的問題是,嘴里喊著風控靠大數(shù)據模型,身體卻很誠實地要靠高息貸款盈利。

雷鋒網AI金融評論報道,6月1日,GIAC 全球互聯(lián)網架構大會在深圳召開。該會議是長期關注互聯(lián)網技術與架構的高可用架構技術社區(qū)推出的、面向架構師、技術負責人及高端技術從業(yè)人員的年度技術架構大會,組委會從互聯(lián)網架構最熱門系統(tǒng)架構設計、工程效率、機器學習、未來的編程語言、分布式架構等領域甄選前沿的有典型代表的技術創(chuàng)新及研發(fā)實踐的架構案例,分享他們在本年度最值得的總結、盤點的實踐啟示,打造一個分享及討論平臺,改變未來一年的互聯(lián)網構建方式。

大會更多的討論的是機構方面的技術創(chuàng)新內容,而在6月1日上午舉辦的Fintech分場上,小贏科技理財研發(fā)中心負責人林實立結合小贏科技的互聯(lián)網金融數(shù)據與應用的演講則是為數(shù)不多的業(yè)務與數(shù)據運用相結合的分享。據介紹,小贏科技成立于14年,是一家快速發(fā)展的金融科技公司,累積交易千億,注冊用戶過千萬,林實立主要負責P2P交易系統(tǒng)的設計研發(fā)工作。

數(shù)據越多模型越復雜越好?這家P2P公司認為關鍵在于“意識”

據雷鋒網了解,小贏科技所采用的數(shù)據架構是基于經典的Lambda架構進行選型的,Lambda架構是Nathan Marz提出的一個實時大數(shù)據處理框架,其核心思路是將大數(shù)據系統(tǒng)架構拆分為Batch Layer、Speed Layer和Serving Layer三部分,其中批處理層(Batch Layer)針對全量數(shù)據進行處理,加速層(Speed Layer)針對實時的增量數(shù)據進行處理,從而達到可以靈活應對任意規(guī)模的數(shù)據處理需求。但據林實立介紹,目前小贏科技的數(shù)據處理“主要還是在離線處理部分,增量處理還是在待建,并沒有用到很大數(shù)據的處理。”

那么,在P2P交易系統(tǒng)中數(shù)據是如何被使用的?林實立舉了兩個例子:

第一個例子是邀請網絡分析,是基于用戶生命周期前端的“獲客”行為的數(shù)據應用。從業(yè)務層面,其希望解答的問題是:邀請的營銷費用花在哪些人上最有效?邀請效果會不會隨時間衰減,具體情況又是什么樣的?

從具體業(yè)務場景看,該分析主要研究邀請人與與受邀人注冊時間上的間隔關系,以及邀請層次與邀請效果的關系。通過對數(shù)據的分析,用于指導P2P平臺在用戶注冊多長時間后發(fā)起補貼最為合適、針對哪些用戶進行補貼最為合適,以及預測一輪邀請補貼在一定的時間內帶來多少新用戶。

小贏科技在對數(shù)據分析中發(fā)現(xiàn):對于普通邀請人(一般用戶)和非普通邀請人(自媒體,大V等),在邀請與注冊的間隔時間、衰減效應、邀請層次與邀請效果的關系有著比較大的區(qū)別。具體來說,普通邀請人的邀請衰減效應較為明顯,而非普通邀請人的衰減效應相對沒有那么明顯,往往還會出現(xiàn)二次或三次的峰值;如果再進一步量化,普通邀請在發(fā)出邀請后到達預期被邀請比例(例如50%)的時間要更短一些,非普通邀請到達預期效果的時間則更長一些。通過經過數(shù)據分析得到邀請的事實關系表,可以大致了解到不同邀請人的再邀請傳播系數(shù),以及在什么時間激發(fā)、激發(fā)哪些用戶、通過什么渠道激發(fā)等指標,從而可以指導促銷的投放。

第二個例子則是高凈值聚類分析。其背景則是,客服部門在人力有限的情況下,如何對高凈值用戶進行更有效的發(fā)展和維護?在具體的分析過程中,技術部門則根據業(yè)務部門定義高凈值用戶范圍,以及高凈值用戶的分類,采用RFM模型進行了分析。


數(shù)據越多模型越復雜越好?這家P2P公司認為關鍵在于“意識”

(雷鋒網按:RFM模型是在用戶關系管理中被廣泛應用的模型,按照最近一次消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)三個維度,對用戶進行細分,根據不同的用戶等級分類,采取不同的營銷策略,并為客戶管理提供依據。)

小贏科技將RFM三個指數(shù)進行量化:

R:最近一次消費,最近一次投資離現(xiàn)在的天數(shù)

F:消費頻率,最近30天的投資次數(shù)

M:消費金額,最近30天的投資金額

在聚類方法選擇中采取等記錄數(shù)和等總數(shù)兩種分類劃分方法,其中R采取等記錄數(shù)分類,越小分數(shù)越高;F采取等記錄數(shù)分類,投資頻率越高分數(shù)越高;M采取等總數(shù)分類,投資金額越高分數(shù)越高,并分為5類按1-5進行評分,在實際業(yè)務中,平臺可以根據對于參數(shù)的重要程度給予不同的權重,最終加權得出RFM分數(shù),根據分數(shù)劃分不同的用戶類別。

互聯(lián)網金融行業(yè)中,如何發(fā)揮數(shù)據的最大價值?

或許是為了“留一手”,在分享中所舉的兩個例子都比較簡單,也沒有涉及到諸如“利用機器學習技術進行大數(shù)據挖掘”的內容。但這實際也引發(fā)了一個問題的討論:在互聯(lián)網金融行業(yè)中,如何發(fā)揮數(shù)據的最大價值?

相比起傳統(tǒng)金融服務,互聯(lián)網金融將金融服務的渠道從線下轉移到了線上,借助用戶流量紅利,互聯(lián)網金融在短時間內發(fā)展出了P2P、眾籌、網貸等創(chuàng)新模式,幫助金融行業(yè)提高了獲客的手段,從而得到了快速發(fā)展。然而在互聯(lián)網金融發(fā)展的早期,互聯(lián)網金融公司的主要利潤來源是“去掉中間環(huán)節(jié)”和流量變現(xiàn),在基于業(yè)務本身的理解和對基于數(shù)據的精細運營上做得并不夠。

隨著2015年對互聯(lián)網金融合規(guī)整頓的展開、2016年的平臺大混戰(zhàn)、2017年的重新洗牌之后,“金融科技”的提法開始逐步抬頭。從“互聯(lián)網金融”到“金融科技”,當中的區(qū)別不僅僅是名字上的改變,而是在業(yè)務理解模式和經營思路上的轉變,基于數(shù)據分析的基礎上,利用機器學習、數(shù)據挖掘、區(qū)塊鏈、云計算等創(chuàng)新技術手段的金融創(chuàng)新活動。在互聯(lián)網金融業(yè)務的的資金運營、投資分析、用戶分析、營銷、風控等各環(huán)節(jié),金融科技都在發(fā)揮著重要的作用。

據雷鋒網了解,互聯(lián)網金融企業(yè)面臨的主要風險為惡意欺詐,70%左右的信貸損失來自于借款人惡意欺詐,每年互金行業(yè)因欺詐所導致的損失在數(shù)百億元級別。因此,風控也成為了互聯(lián)網金融創(chuàng)新的重地,幾乎每家轉型的互金公司都在稱“我們的核心競爭力是大數(shù)據風控”,在對外的宣傳資料中,這些大數(shù)據風控模型往往具有幾千個甚至上萬個變量,以“凸顯”其技術實力。

然而在會場,一位不愿意透露姓名的從業(yè)人士告訴雷鋒網,大數(shù)據并不能完全解決風控的問題。在他看來,目前成千上萬個參數(shù)的風控模型過于復雜,并不一定能完全反應實際的風險情況,甚至由于需要考慮的東西太多,可能會影響結果,而且同一套風控體系,換了一個環(huán)境效果就會大不相同。

“比如說支付寶的個人信貸業(yè)務做得很好,我們看到的可能是基于芝麻信用成千上萬個參數(shù)的風控,但實際上可能是因為,如果一個人在支付寶借錢不還,他可能就沒法使用相關業(yè)務,沒法在淘寶上買想要的東西,而這是數(shù)據上看不出來的。”他和雷鋒網舉例道。

在機器學習領域,過多的無關參數(shù)帶來的噪音干擾被稱為“過擬合”。關于參數(shù)的一個經典故事是費米曾經說過,“我的朋友馮·諾依曼用四個參數(shù)就可以擬合出一頭大象,用五個參數(shù)可以讓它的鼻子擺動?!币敫嗟膮?shù),可能會增加模型的精確程度,但如果選擇了不恰當?shù)膮?shù),則有可能會反過來干擾結果。

而在實際業(yè)務中,基于大數(shù)據分析也有著不小的難度。金融業(yè)務屬于業(yè)務復雜的強監(jiān)管業(yè)務,存在建模困難的問題;同時可利用的數(shù)據多元化,但評價往往是有限的。成千上萬的變量,如何將這些多維數(shù)據變?yōu)槟芊窠杩?、可以借多少的一維數(shù)據,不同風控系統(tǒng)會有不同評價,這也是最具挑戰(zhàn)性的地方。

而且這樣的問題,并不一定能通過“開放數(shù)據”的方式得到解決。面對同一個征信系統(tǒng),各家銀行的效率、風險控制、定價能力并不一樣,面對數(shù)據開放后透明的數(shù)據,即便有許多可以提供解決方案的金融科技公司輸出技術,但真正決定大數(shù)據的效果的,還在于使用大數(shù)據這把“屠龍刀”的人。

如林實立在分享中的觀點:數(shù)據的運營不在與多復雜,而是有沒有應用的意識,在產品、開發(fā)、測試鏈條里對建模流程,有一個清晰的認識,才能有很好的配合,起到實際的指導作用。

但真正做好這一點并不容易,想要在成千上萬個參數(shù)中找到對業(yè)務起關鍵作用的參數(shù),不同的人群、不同的環(huán)境、不同的業(yè)務,起決定作用的參數(shù)可能各不相同,這對金融公司來說無異于摸著石頭過河,即便碰巧找對了參數(shù),也可能只是“煉金巫師的煉金術”。

“風控靠大數(shù)據模型,盈利靠高息貸款”,這也是整個P2P乃至整個互聯(lián)網金融目前存在的問題。毫無疑問,大數(shù)據的使用可以優(yōu)化管理,提高風控效率,降低風控成本,但從目前的應用來看,還是有很長的路要走。

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章

編輯

關注金融科技前沿!在這里,讀懂智能金融與未來!
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說