從淘寶的 “花唄” 到京東的 “京東白條”,再到芝麻科技旗下針對線下零售門店推出的實(shí)時(shí)導(dǎo)購助手 “知了”、結(jié)合了線下商業(yè)消費(fèi)數(shù)據(jù)及線上消費(fèi)軌跡的 “觀星”,似乎大數(shù)據(jù)還被禁錮在互聯(lián)網(wǎng)企業(yè)的圈子內(nèi)。互聯(lián)網(wǎng)大數(shù)據(jù)在于掌握了許多傳統(tǒng)數(shù)據(jù)方及征信方拿不到的數(shù)據(jù),例如在國外,已經(jīng)有公司在分析用戶的 Facebook、LinkedIn 和 Twitter 賬戶來評估他們的信用情況。包括美國的企業(yè)征信巨頭鄧白氏近年的戰(zhàn)略主要有二:增強(qiáng)數(shù)據(jù)挖掘能力,兼并掌握技術(shù)的企業(yè);與互聯(lián)網(wǎng)數(shù)據(jù)掌控方戰(zhàn)略合作,共享數(shù)據(jù)。
今年6月,浦發(fā)銀行信用卡中心宣布與騰訊征信開展合作,借助互聯(lián)網(wǎng)大數(shù)據(jù)對客戶消費(fèi)行為和誠信記錄作出盡可能全面的綜合分析,開展基于互聯(lián)網(wǎng)大數(shù)據(jù)的第三方征信服務(wù),這在傳統(tǒng)金融機(jī)構(gòu)中算得上是第一家。
那么,除了暢想在未來的某一天,企業(yè)可以結(jié)合第三方數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)做更多征信業(yè)務(wù)之外,積累了千萬級用戶數(shù)十億條消費(fèi)信息數(shù)據(jù)的傳統(tǒng)銀行,該如何利用自己原有的業(yè)務(wù)數(shù)據(jù)積累做到實(shí)際上的線下營銷落地?畢竟,線下的消費(fèi)數(shù)據(jù)沉淀時(shí)間更久,關(guān)聯(lián)著的信用卡賬戶甚至還包括許多個(gè)人資產(chǎn)證明、工資證明等材料,跟互聯(lián)網(wǎng)企業(yè)相比,省去了線下征信調(diào)查的步驟。
浦發(fā)信用卡中心的首次嘗試的切入點(diǎn)在信用卡,并選擇了天璣科技的大數(shù)據(jù)團(tuán)隊(duì)作為解決方案提供商,而在天璣科技背后,更有智樹科技等科技創(chuàng)新公司提供大數(shù)據(jù)技術(shù)分析的支撐。除了上述線下數(shù)據(jù)沉淀的優(yōu)勢之外,選擇此次合作,是因?yàn)樾庞每ㄖ行睦么髷?shù)據(jù)做業(yè)務(wù)落地能挖掘用戶的增量消費(fèi)需求嗎?
對于這個(gè)提問,天璣科技的大數(shù)據(jù)團(tuán)隊(duì)負(fù)責(zé)人梁晟認(rèn)為,信用卡的透支功能、用戶消費(fèi)特征都需要大數(shù)據(jù)做把控,并做實(shí)時(shí)營銷方案,“信用卡中心是最關(guān)注用戶行為、消費(fèi)習(xí)慣,希望用戶多刷卡消費(fèi),獲得更多的流量。主要的目的:第一,獲客,拿下增量的客戶群體;第二,爭取讓已有的客戶增加消費(fèi)。浦發(fā)銀行信用卡的客戶群主要是華東區(qū)的白領(lǐng),都是收入相對比較高的人群”,這其中的數(shù)據(jù)含金量很高。
梁晟畢業(yè)于復(fù)旦大學(xué)計(jì)算機(jī)系,碩士學(xué)位,多年來從事金融、運(yùn)營商的應(yīng)用架構(gòu)和咨詢,對大數(shù)據(jù)的實(shí)踐落地有著許多獨(dú)到見解,并同時(shí)帶領(lǐng)團(tuán)隊(duì)選擇了銀行業(yè)這個(gè)數(shù)據(jù)價(jià)值密度較高的行業(yè),以信用卡業(yè)務(wù)作為切入點(diǎn),在促進(jìn)信用卡業(yè)務(wù)獲客、營收甚至風(fēng)控等方面,邁出了實(shí)踐的一大步。在他看來,信用卡的三大痛點(diǎn)及背后根由,主要分為實(shí)時(shí)營銷、數(shù)據(jù)關(guān)聯(lián)、銀行缺乏落地實(shí)踐等,歸納總結(jié)如下:
第一,信用卡交易的數(shù)據(jù)量特別大,用戶量千萬級,用戶歷史信息和記錄數(shù)十億,年交易量超越了十億級。而與之對應(yīng)的,核心系統(tǒng)還是基于原有的成熟架構(gòu)的系統(tǒng),主要針對 OLTP 的在線事務(wù)處理。原有的核心系統(tǒng)運(yùn)行穩(wěn)定,但不適合做在線數(shù)據(jù)分析的處理。
通常用戶刷完卡之后,核心系統(tǒng)需要對用戶進(jìn)行復(fù)雜的狀態(tài)計(jì)算,才能作出這筆交易成功、或者不成功的判斷,這個(gè)過程在系統(tǒng)中必須確保整個(gè)事務(wù)的完整性。整個(gè)計(jì)算過程數(shù)據(jù)處理量是多少?速度怎樣?梁晟回答,“大數(shù)據(jù)服務(wù)平臺現(xiàn)在做到以單節(jié)點(diǎn)數(shù)萬筆 / 秒規(guī)則匹配。分布式架構(gòu)是計(jì)算集群,原則上可以線性擴(kuò)展,以時(shí)間衡量的話,處理速度為微秒級”。
在判定這筆交易成功后,系統(tǒng)先進(jìn)行虛擬賬的記錄,可能到當(dāng)日統(tǒng)一清算時(shí),再記錄會計(jì)賬。整個(gè)事務(wù)處理的復(fù)雜性的要求導(dǎo)致核心系統(tǒng)騰不出時(shí)間做實(shí)時(shí)營銷,并且使用的還是傳統(tǒng)的技術(shù)架構(gòu)以及數(shù)據(jù)處理方法。一旦在任何環(huán)節(jié),會計(jì)賬或者虛擬賬出現(xiàn)偏差,其錯(cuò)誤原因的排查往往要耗費(fèi)大量精力。為了保證數(shù)據(jù)的一致性,銀行信用卡業(yè)務(wù)往往相對弱化性能,更難以進(jìn)行更多的實(shí)時(shí)營銷支持。
第二,隨著日積月累的數(shù)據(jù)沉淀,核心系統(tǒng)和各類業(yè)務(wù)應(yīng)用系統(tǒng)的數(shù)據(jù)也越來越雜亂,“噪音” 越來越多。數(shù)據(jù)處理系統(tǒng)多,可能每個(gè)系統(tǒng)都有分析、數(shù)據(jù)挖掘的功能,但是數(shù)據(jù)必須形成關(guān)聯(lián)圈。需要有一個(gè)大數(shù)據(jù)的平臺獨(dú)立在信用卡核心系統(tǒng)之外,把數(shù)據(jù)進(jìn)行清洗,更關(guān)注用戶、做用戶畫像,更主動甚至自動進(jìn)行實(shí)時(shí)性的營銷和推廣,且保證逐步增長的精準(zhǔn)性。
第三,不能做到對用戶的實(shí)時(shí)營銷。原本的核心系統(tǒng)在包括長事務(wù)的多個(gè)環(huán)節(jié),需要對許多信息進(jìn)行判定、核實(shí)(比如額度是否透支、上期還款是否已到位)才能確保交易成功,沒法同時(shí)完成實(shí)時(shí)營銷。如果在核心系統(tǒng)之外另外開發(fā)一套數(shù)據(jù)系統(tǒng),導(dǎo)入新流入的用戶交易大數(shù)據(jù),那么就可以在核心系統(tǒng)之外做到數(shù)據(jù)的實(shí)時(shí)更新,既不影響核心系統(tǒng)的事務(wù)處理,又可以據(jù)實(shí)時(shí)更新的數(shù)據(jù),并以這些數(shù)據(jù)做在線實(shí)時(shí)分析,觸發(fā)事件式精準(zhǔn)營銷。