中國IDC圈6月3日報道,大數(shù)據(jù)可以說是2015年和2016年的重點話題,隨著國家對此的鼓勵與推進,國內(nèi)外各金融與類金融機構(gòu)、互聯(lián)網(wǎng)金融企業(yè)紛紛上馬大數(shù)據(jù)應(yīng)用的探索,冀望大數(shù)據(jù)可以帶來技術(shù)上的突破,實現(xiàn)自動化、著手升級現(xiàn)有風控模型體系、探索新型態(tài)基于場景化的消費金融市場、提升催收效率、建設(shè)互聯(lián)網(wǎng)深層次大面積獲客能力,從而徹底提升國家金融行業(yè)的國際競爭力。
大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的差異
談到大數(shù)據(jù),首先應(yīng)當了解,對金融行業(yè)來說,大數(shù)據(jù)“大”在哪里,和傳統(tǒng)數(shù)據(jù)在本質(zhì)上有什么樣的不同,才能夠更好地理解和更有針對性地應(yīng)用這寶貴的新資源。就如同原油也需要經(jīng)過層層的提煉,才能成為人類可以大量應(yīng)用的石油產(chǎn)品,大數(shù)據(jù)也需要經(jīng)過精心的篩選和應(yīng)用設(shè)計,才能起到實質(zhì)的功效。
傳統(tǒng)金融機構(gòu),在建設(shè)信用風險打分模型的數(shù)據(jù)來源主要有幾個方面:第一,人民銀行征信中心數(shù)據(jù);第二,客戶自己提交的外部個人財力證明數(shù)據(jù),如房產(chǎn)證、汽車行駛證、單位開具的收入證明等;第三,金融機構(gòu)或集團內(nèi)部積累的客戶歷史數(shù)據(jù),如銀行的工資流水,歷史貸款數(shù)據(jù),保險數(shù)據(jù)等。
1.傳統(tǒng)數(shù)據(jù)的優(yōu)點和缺點
傳統(tǒng)數(shù)據(jù)優(yōu)點是這些數(shù)據(jù)和金融的價值相關(guān)性高、數(shù)據(jù)采集規(guī)范。然而缺點是維度較小,并且覆蓋的人群有限,對于新形態(tài)的互聯(lián)網(wǎng)模式適應(yīng)程度較差,也不容易達到普惠覆蓋的目的。
金融機構(gòu)基于這些高價值數(shù)據(jù),紛紛設(shè)計出各種信用風險評分模型,最終實現(xiàn)對客戶信用風險的打分評估,是目前較為成熟的運行方式。
2.大數(shù)據(jù)的特點
大數(shù)據(jù)時代的客戶信息渠道更加多元化,主要包括內(nèi)部收集和外部渠道,內(nèi)部收集指各互聯(lián)網(wǎng)生態(tài)體系內(nèi),長期積累的用戶數(shù)據(jù)。外部渠道則是指各種數(shù)據(jù)源采集,如通信數(shù)據(jù)、社保數(shù)據(jù)、法院失信數(shù)據(jù)、交通數(shù)據(jù)、保險數(shù)據(jù)等等。
其數(shù)據(jù)特征包括幾個方面,第一,數(shù)據(jù)覆蓋面廣。各大互聯(lián)網(wǎng)集團,通過各種APP采集積累了用戶行為各方面的數(shù)據(jù),如搜素歷史數(shù)據(jù)、電商交易數(shù)據(jù)、支付交易數(shù)據(jù)、社交數(shù)據(jù),以及各種APP采集的用戶行為數(shù)據(jù)等等。第二,大量非結(jié)構(gòu)化的破碎數(shù)據(jù)導(dǎo)致的數(shù)據(jù)不準確。數(shù)據(jù)采集渠道的多元化和非標準化,隨之帶來的問題就是,客戶信息不準確,同一客戶不同維度的信息經(jīng)常不完整或匹配不上。第三,數(shù)據(jù)來源不穩(wěn)定。不少大數(shù)據(jù)采集通過灰色渠道收集個人隱私數(shù)據(jù),數(shù)據(jù)連續(xù)性和可持續(xù)性欠佳,往往有數(shù)據(jù)過時或缺失問題。第四,消費數(shù)據(jù)和信用數(shù)據(jù)關(guān)聯(lián)性弱。
盡管市場上常見的大數(shù)據(jù)機構(gòu)收集了各種維度的客戶行為信息,試圖描繪客戶畫像,但消費類的數(shù)據(jù)和客戶信用風險以及還款意愿并不直接相關(guān)。目前的大數(shù)據(jù)公司往往缺少內(nèi)部征信數(shù)據(jù)、外部征信數(shù)據(jù)、個人資產(chǎn)數(shù)據(jù)等強金融變量數(shù)據(jù),而集中在客戶衣食住行和社交信息,要直接拿來作為信用風險評分模型的有效性依舊有待考驗??紤]到大數(shù)據(jù)和傳統(tǒng)金融數(shù)據(jù)的差異性和互補性,所以更多的應(yīng)該是如何通過模型的設(shè)計和提煉,使得這些大數(shù)據(jù)源經(jīng)過提煉,可以從原油變成成品石油般廣為應(yīng)用。
大數(shù)據(jù)在借貸中的應(yīng)用
1.借貸反欺詐
由于網(wǎng)絡(luò)借貸和傳統(tǒng)金融面對的受眾區(qū)別,借款人主要來自線上,考慮到目前網(wǎng)絡(luò)犯罪的試錯成本極低,為數(shù)眾多的網(wǎng)絡(luò)借貸平臺很容易成為詐騙集團覬覦的目標,一般根據(jù)行業(yè)經(jīng)驗,網(wǎng)絡(luò)借貸平臺往往都會有高達九成的借款需求存在欺詐和騙貸行為風險。因此借貸反欺詐的重點在于從100名潛在借款人當中,準確識別出真正有還款意愿的10名借款人。
通過技術(shù)的防范手段很多元化,一般通過核實手機號、身份證號碼、電腦唯一設(shè)備號、手機唯一設(shè)備號,可以進行下列過濾識別手段:交叉比對借款人登記的住家地址、公司地址,以及申請人當時申請的定位地點,如果差距超過10公里,風險系數(shù)極高;某些地址或大樓,屬于申請詐騙高發(fā)地址的,風險系數(shù)偏高,會得到一個分值;發(fā)現(xiàn)和多個平臺同時存在借款記錄的,風險系數(shù)偏高;手機號屬于法院黑名單、租車黑名單、使用時間段不足6個月、被多次標記惡意騷擾電話等,風險系數(shù)偏高;6個月內(nèi),同一個手機設(shè)備號,曾經(jīng)在銀行、小貸公司、多家P2P平臺有過多次申請記錄的,風險系數(shù)極高;手機設(shè)備號近一天關(guān)聯(lián)申請人3個手機號以上的,風險系數(shù)極高;手機號與設(shè)備是否匹配、第一次激活時間距離申請貸款時間較近,風險系數(shù)較高。