如果按照這個界定,我們現(xiàn)在所談到的大數(shù)據(jù)征信跳脫了傳統(tǒng)“征信”范疇內。不再局限于金融屬性的信息,并且也打破了“采集者與信息產生沒有任何關系”的獨立第三方原則。
例如芝麻信用、前海征信、騰訊征信,一方面它們的數(shù)據(jù)來源目前還主要來自母公司阿里、平安、騰訊,而另一方面,它們的兄弟公司又涉足放貸業(yè)務,例如阿里小貸。
盡管有關大數(shù)據(jù)征信的定義和效用仍爭議不斷,但對于既無法接入央行征信系統(tǒng)又面臨快速發(fā)展的互聯(lián)網(wǎng)金融行業(yè)而言,利用大數(shù)據(jù)來幫助判定風險、開拓業(yè)務已是必然的選擇。
從應用范圍來看,目前大數(shù)據(jù)征信已從金融業(yè)務向生活服務蔓延。其中,最核心的兩個價值就是:防范欺詐風險和信用風險。簡單來說就是:既要證明“你是你”,還要描述出“你是什么樣的人”。
如何證明“你是你”?
無論是在傳統(tǒng)金融領域,還是互聯(lián)網(wǎng)金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。所以,如何利用證明“你是你”是大數(shù)據(jù)征信首先要解決的問題。
尤其,隨著越來越多的金融業(yè)務互聯(lián)網(wǎng)化,“反欺詐”面臨的挑戰(zhàn)也日益增大。“身份認證”的重要性在各項監(jiān)管文件中反復被強調,而各家機構也在不斷探索如何利用新的技術在網(wǎng)上實現(xiàn)身份的核實。
其中,在指紋、虹膜、人臉識別等一系列生物識別技術中,人臉識別因其技術的成熟度和準確率,以及使用的便捷性而被進一步普及。包括騰訊征信、芝麻征信在內的多家個人征信機構都有組建自己的人臉識別技術團隊。
此前,在騰訊征信的北京媒體溝通會上,為騰訊財付通、微眾銀行、騰訊征信等提供圖像和模式識別技術支持的優(yōu)圖團隊也向大家展示了“人臉識別”在“反欺詐”方面的應用,即如何證明“你是你”。
根據(jù)現(xiàn)場的演示,在上傳身份證照片、自拍照片并與公安部的信息進行比對之后,“人臉識別”的另一關鍵步驟是活體檢測,通過讀取隨機的數(shù)字串,分析聲音和唇語等信息來防范有人用視頻、照片等方式來仿冒用戶。
據(jù)了解,在今年國際權威的人臉識別數(shù)據(jù)庫LFW上,騰訊優(yōu)圖團隊在人臉驗證測試中達到了 99.65%的準確率。目前,微信的“人臉識別”技術已經在騰訊征信、微眾銀行、微證券開戶等場景中開始試用。
盡管人臉識別的準確率已經達到較高水平,但該項技術的商業(yè)化應用才剛剛起步,它的有效性和安全性仍備受質疑。
優(yōu)圖團隊研發(fā)總監(jiān)黃飛躍也表示,該技術現(xiàn)在還不能說100%的成熟,而是適用于某些特定的應用環(huán)境中。其中,金融領域的身份核實條件較好,由于用戶往往是為了通過驗證(例如支付)所以比較配合。
芝麻信用首席科學家俞吳杰表示,整個的反欺詐產品從身份認證到信息驗證再到網(wǎng)絡關聯(lián),每一步的技術含量非常高。以身份認證為例,現(xiàn)在已有有很多的途徑,比如信息交叉比對、人臉識別技術、KBA問答認證等。
他以網(wǎng)絡關聯(lián)技術為例說明到,它能把所有出現(xiàn)過違約行為的身份,手機,設備等關鍵點都在風險庫里面分門別類的保留下來,我們可以通過一層或者多層關聯(lián)找出所有的風險點供合作伙伴參考,這對技術和硬件要求都是非常高的。
爭議大數(shù)據(jù)征信
解決了“身份認證”的問題,接下來就要評估你的信用,即描述出“你是什么樣的人”。
在關于大數(shù)據(jù)征信的文章中,我們經??梢钥吹揭恍┌咐?,如經常半夜上網(wǎng)的用戶可能被認為沒有穩(wěn)定的工作而降低信用評分,買雙開門冰箱的用戶可能因為有家庭而信用評分較高,微博更新頻繁的用戶可能因為社交活躍而信用評分較高等。
“這些考量因素被過度放大了,也許這只是用戶個人習慣而已。但每一個因素與個人信用的相關性有多大?我們還無法完全解釋,尤其當數(shù)據(jù)源不足夠豐富時,這些評判便存在欠缺。”芝麻信用的技術專家景藝亮表示。
冰鑒科技CEO顧凌云在回國前曾領導并開發(fā)了Zest Finance前四代風控模型,在他看來,大數(shù)據(jù)征信的核心并不是對某個變量極其依賴,而是把很多個都只有微小影響的變量通過非線性的算法整合在一起,從而使模型的整體表現(xiàn)更好。
“大數(shù)據(jù)其實并不一定就是數(shù)據(jù)量本身大,我們講求的是變量涵蓋的信息緯度要多和均衡,然后才是能夠通過淺度學習和深度學習等多種復雜的算法把這些變量更有效地柔和在一起。”他表示。