當(dāng)今大數(shù)據(jù)風(fēng)行一時,各行各業(yè)都趨之若鶩。在征信業(yè)更是如此。但如果認(rèn)真的問一下,什么是大數(shù)據(jù),卻沒有一個一致的答案。
很多分析認(rèn)為借貸雙方信用信息是非對稱的(asymmetric),大數(shù)據(jù)可以幫助貸方彌補與借方信息的差距。這個論點的前提是對的,但美國的經(jīng)驗證明信用報告能夠很好的解決這個問題。而大數(shù)據(jù)用于征信存在一些很難逾越的障礙。
大數(shù)據(jù)由來
準(zhǔn)確性是征信的第一準(zhǔn)則。本著這種精神,我們來看一下大數(shù)據(jù)的由來和其準(zhǔn)確定義。
在美國計算機協(xié)會數(shù)字圖書館中,大數(shù)據(jù)(Big Data) 第一次出現(xiàn)是在1997年10月,邁克爾·考克斯 (Michael Cox)和大衛(wèi)·埃爾斯沃思(David Ellsworth)發(fā)表的一篇關(guān)于處理圖像數(shù)字化后數(shù)據(jù)量管理的文章里 。 文章開頭指出 “圖像數(shù)字化給計算機系統(tǒng)出了一個有趣的難題,數(shù)據(jù)都相當(dāng)大,占用主存儲器,終端磁盤,甚至遠(yuǎn)程磁盤的容量。我們稱之為大數(shù)據(jù)的問題。” 從這以后,數(shù)據(jù)隨著互聯(lián)網(wǎng)的發(fā)展呈現(xiàn)爆炸式增長。“大數(shù)據(jù)”也成為各行各業(yè)的一個熱門的話題。
明白“大數(shù)據(jù)”始于圖像數(shù)字化非常重要。大數(shù)據(jù)包括:可視化數(shù)據(jù) – 視頻,照片,指紋印記等;言語數(shù)據(jù) – 聲音和語言,其他聲音(動物,自然);社會關(guān)系 – 工作和個人關(guān)系(LinkedIn);各種同時和即時的活動 -人類,動物或自然(信用卡交易,微博,人類活動,傳感器和計量器等);等等。但占壓倒性比例的數(shù)據(jù)是影像。思科(Cisco)公司去年的報告指出,目前美國78%的互聯(lián)網(wǎng)流量是影像。這一比例在三年內(nèi)會增加到84%。影像在所有新創(chuàng)數(shù)據(jù)中的比例,應(yīng)該是接近或超過它在互聯(lián)網(wǎng)流量中所占的份額。
具體到征信領(lǐng)域,通常把信息局和銀行搜集的數(shù)據(jù)叫做常規(guī)數(shù)據(jù),其他的叫大數(shù)據(jù)。
大數(shù)據(jù)包括了所有可以獲得和可以產(chǎn)生的數(shù)據(jù)。和常規(guī)數(shù)據(jù)相比,“大數(shù)據(jù)”種類多樣(影像),產(chǎn)生速度更快(90%的數(shù)據(jù)是近兩年產(chǎn)生的),數(shù)據(jù)量比常規(guī)數(shù)據(jù)大千倍萬倍。這些特點使得傳統(tǒng)數(shù)據(jù)分析工具和方法難以應(yīng)對。
美國征信業(yè)的起源
國務(wù)院“征信管理條例”對“征信業(yè)務(wù)”做出了明確定義:“征信業(yè)務(wù)是指依法收集、整理、保存、加工個人、法人及其他組織的信用信息,并對外提供信用報告、信用評分、信用評級等的業(yè)務(wù)活動”。簡而言之,征信是建立和提供“信用檔案”和“信用評級”。
將此“征信業(yè)務(wù)”定義用于美國,它包括了四項相當(dāng)不同的業(yè)務(wù):
1.個人信用信息局 — 包括美國三大信用信息局Equifax、Experian、和Trans Union 和很多小型個人信息公司。
2.信用評分 — 主要用于個人。FICO(費埃哲)基本上壟斷了這一行業(yè)。
3.商業(yè)信用信息局 — 未上市公司的信用信息主要由一家公司Dun & Bradstreet(鄧白氏)壟斷。上市公司信用信息公開,在美國證卷交易委員會(SEC)的網(wǎng)站上即可獲得。
4. 信用評級 — 主要用于商業(yè)公司。美國有很多企業(yè)在這一領(lǐng)域。但最重要的有三家Standard & Poor’s (S&P), Moody’s, 和 Fitch Group.
個人和企業(yè)征信有根本的區(qū)別。本文只討論個人征信。企業(yè)征信將在另一篇詳細(xì)論述。
在美國,當(dāng)一個人到銀行去借錢,銀行要對借款人進(jìn)行“5C” (Character、Capacity、Capital、Collateral、Conditions)貸前分析和審查,以確定借款者是否會還本付息。分析和審查需要的數(shù)據(jù),包括認(rèn)識借款者是誰和其人品,以前是否借過錢,是不是有過借錢不還的記錄(Character);借多少錢,什么用途;最近幾年收入多少;借款人財產(chǎn)情況;根據(jù)收入和財產(chǎn)判斷它是否能按時還錢 (Capacity);如果借錢買房,本金占多少比例(Capital);房子價格、狀況(Collateral);此外還要分析當(dāng)?shù)氐姆渴泻徒?jīng)濟情況(Conditions)。銀行會要求借款人提供一系列的證明材料:收入、財產(chǎn)證明、銀行月報、信用卡和已有房貸月報,以及其它報表;銀行的信貸員還要打電話給申請人單位或者登門拜訪,以了解申請人的人品、收入可靠性和穩(wěn)定性等。銀行要花很多時間,做很多工作。如果借款額大(在美國高于十萬美元),銀行有錢賺,借款人也可以理解。但如果是申請一個少于三萬美元的信用卡,上述的過程讓銀行代價太大,借款人也很麻煩。這個小額貸款對借貸雙方費用都太高,也就做不成了。當(dāng)這成了一個需要解決的社會問題時,征信業(yè)應(yīng)運而生,其目的是提供一個“信用檔案”來減少或取消信貸、保險及雇傭過程中所需數(shù)據(jù)的采集和費用。