如今,隨著社會不斷發(fā)展,技術(shù)不斷進(jìn)步,國內(nèi)外各大金融機(jī)構(gòu)已經(jīng)在大數(shù)據(jù)、人工智能、區(qū)塊鏈等新技術(shù)上有很多嘗試,智能客服、智能投顧等新金融形式也早已不新鮮。那么,這些前沿新科技遇到嚴(yán)肅謹(jǐn)慎的金融業(yè),究竟是“黑科技”般的存在,還是技術(shù)宅們的另一場狂歡呢?
以下是氪信聯(lián)合創(chuàng)始人楊玢玢在《當(dāng)金融遇上黑科技》線下主題沙龍活動的精彩分享:
大家好!我是氪信楊玢玢,負(fù)責(zé)氪信產(chǎn)品研發(fā)。氪信的全稱是氪信信息技術(shù)有限公司(CreditX),最近剛剛完成了B輪融資。團(tuán)隊的核心人員均來自于雅虎、微軟、攜程、eBay、央行等世界知名公司和機(jī)構(gòu),在人工智能領(lǐng)域有超過10年的積累。
在氪信創(chuàng)立之初,我們主要思考這樣一個問題:AI應(yīng)用在金融領(lǐng)域里,如何能夠在商業(yè)上有所突破?李開復(fù)老師也針對這個問題說過他的觀點(diǎn):想要有所突破,需要幾個必要因素,一個是要有數(shù)據(jù),畢竟AI歸根究底還是數(shù)據(jù)的技術(shù);另外要有處理數(shù)據(jù)的能力,其次還要有商業(yè)變現(xiàn)的場景。技術(shù)單獨(dú)存在不能產(chǎn)生價值,一定要放在一個對技術(shù)有需求的場景里面。
我們認(rèn)為,把AI技術(shù)應(yīng)用于金融領(lǐng)域是一個突破點(diǎn),而且金融本身是數(shù)據(jù)化非常完善的場景。同時,金融領(lǐng)域還具備以下幾個要素:
第一,市場本身快速發(fā)展。在國內(nèi)目前征信體系不是很完善的情況下,很多有金融需求的人得不到相應(yīng)的金融服務(wù)。氪信通過對數(shù)據(jù)的搜集和加工,為符合要求的用戶提供金融服務(wù)。
第二,數(shù)據(jù)端非常成熟。如今,大家花在手機(jī)上的時間特別多,互聯(lián)網(wǎng)行為就是一個非常好的數(shù)據(jù)。關(guān)鍵在于如何把它和金融、信用相結(jié)合,怎么去擬合他們之間的關(guān)系。而這種信任評估是氪信比較擅長的。
從我們決定把AI的技術(shù)應(yīng)用于金融風(fēng)控,至今已有一年半的時間,在這段實踐過程中,我們看到在技術(shù)層面、業(yè)務(wù)層面和戰(zhàn)略層面都存在很多痛點(diǎn),概括來說,就是業(yè)務(wù)本身對技術(shù)提出了需求。比如2016年蓬勃發(fā)展的小額現(xiàn)金貸業(yè)務(wù),本身就是一個欺詐頻發(fā)的行業(yè),且沒有強(qiáng)數(shù)據(jù)做支撐,因此,很多從業(yè)十幾年的金融風(fēng)控專家在面對新業(yè)務(wù)形態(tài)時,顯得有些束手無策。
沒有強(qiáng)數(shù)據(jù)不代表沒有數(shù)據(jù),事實上,企業(yè)還是能夠拿到一些所謂的“弱數(shù)據(jù)”,比如手機(jī)上的數(shù)據(jù),設(shè)備類的數(shù)據(jù),或者一些消費(fèi)類的數(shù)據(jù)。拿到數(shù)據(jù)之后去想怎么把這些數(shù)據(jù)用好,最后再決定要不要給這個人授信。至于授信多少,就需要用到AI技術(shù)了。
接下來分享一下氪信的做法和取得的成果。簡單來講風(fēng)控分為兩個部分:一個是反欺詐,一個是授信。
在實踐過程中,我們發(fā)現(xiàn)區(qū)別于傳統(tǒng)征信,互聯(lián)網(wǎng)征信存在幾個核心的點(diǎn): 第一,在反欺詐的階段,傳統(tǒng)征信很難捕捉到一些不是很明顯的、由于社交關(guān)系和其它關(guān)系對自己產(chǎn)生的潛在風(fēng)險,例如一些團(tuán)貸、群體欺詐的問題。但是這些問題通過挖掘網(wǎng)絡(luò)數(shù)據(jù)價值就可以得到很好的解決。
第二,了解AI的人都清楚,我們在做數(shù)據(jù)加工的時候,主要還是做特征和建模。在加工的過程中,除了運(yùn)用專家的方法之外,深度學(xué)習(xí)也被驗證效果突出。建模階段相比較傳統(tǒng)的淺層模型,比如說邏輯回歸等等模式,我們采用的是復(fù)雜的集成模型方式,因為不同維度的數(shù)據(jù)具有不同的特點(diǎn),需要使用不同的建模方法,集成學(xué)習(xí)框架可以支持不同類型模型算法作為子模型,高效、準(zhǔn)確的處理稀疏、超高維、非線性數(shù)據(jù)建模。
接下來我會分別講一下我們公司的做法:
第一是底層,我們需要把能夠拿到的數(shù)據(jù)定義為網(wǎng)絡(luò)需要的關(guān)系,底層做一個數(shù)據(jù)的整合;第二層我們會到一些復(fù)雜的網(wǎng)絡(luò)構(gòu)建基礎(chǔ),里面有一些信息挖掘和算法;再往上我們會有一些模型,從網(wǎng)絡(luò)里面拿到隱含的特征,去進(jìn)行模型的構(gòu)建;最終來識別比如說一些虛假的申請,或者是一些特殊地域的團(tuán)貸等。
在網(wǎng)絡(luò)的算法里面,我們的主要核心是復(fù)雜網(wǎng)絡(luò)構(gòu)建和團(tuán)挖掘技術(shù)兩塊。首先在原始的點(diǎn)和邊構(gòu)建好以后,我們?nèi)绾瓮ㄟ^合理算法解決實際的問題,通過團(tuán)的距離計算,達(dá)到比較良好的分團(tuán)的結(jié)果。
另外一個是特征,這個也是非常關(guān)鍵的。我們?nèi)绾螐木W(wǎng)絡(luò)里面提取對一個人的欺詐識別比較有用的信號特征。在這方面,傳統(tǒng)的做法是會有一些個人的風(fēng)險特征,或者關(guān)聯(lián)人,大概多少壞人,這些是我們?nèi)四芟氲降奶卣鳌?