另外在我們的實(shí)踐應(yīng)用過程中,我們發(fā)現(xiàn)在突破單個(gè)風(fēng)險(xiǎn)點(diǎn)來臨的時(shí)候,整個(gè)網(wǎng)絡(luò)會(huì)出現(xiàn)一些局部風(fēng)險(xiǎn),并形成連接,比如說形成一些三角或者四角的關(guān)系等。從長遠(yuǎn)的時(shí)間上看,這樣的關(guān)系可能未必不正常,但是一定時(shí)間內(nèi),你的申請人形成了非常緊密的聯(lián)系,這件事情是值得注意的。
除了個(gè)人局部的風(fēng)險(xiǎn)特征以外,還有全局的。我們用到了一些優(yōu)化后的算法,每一個(gè)人在整個(gè)網(wǎng)絡(luò)中,都會(huì)出現(xiàn)一些高的風(fēng)險(xiǎn)點(diǎn),對和他有社交關(guān)系的人也會(huì)存在輻射效應(yīng)。對于個(gè)人來說,可能在一度二度三度關(guān)系上,會(huì)和一個(gè)或是幾個(gè)壞人有一些聯(lián)系,現(xiàn)在社交比較發(fā)達(dá),如果出現(xiàn)大片這樣子的人,可以通過輻射算法捕捉到這樣的信號。
另外在網(wǎng)絡(luò)這塊,很重要的一點(diǎn)就是整個(gè)系統(tǒng)的回轉(zhuǎn)和流程優(yōu)化。因?yàn)榫W(wǎng)絡(luò)欺詐有一個(gè)特性,對于實(shí)時(shí)性甄別以及實(shí)時(shí)修改性上限要求特別高,同時(shí)我們學(xué)習(xí)的目標(biāo),不是一個(gè)純事實(shí),很多都是學(xué)習(xí)專家認(rèn)定為欺詐的經(jīng)驗(yàn),這樣的結(jié)果對本身的優(yōu)化是很有價(jià)值的,從整個(gè)產(chǎn)品來看,形成了數(shù)據(jù)加工、數(shù)據(jù)計(jì)算和反饋的閉環(huán)。
我們也有專家的界面,網(wǎng)絡(luò)捕捉風(fēng)險(xiǎn)之后,我們的專家都可以看到。
下面分享一下我們氪信在特征加工上的實(shí)踐??赡芰私釧I的人特別清楚,我們最后做模型結(jié)果的時(shí)候,如果是優(yōu)秀的話,這個(gè)優(yōu)秀的絕大部分來自于我們非常辛苦的加工過程。
我們會(huì)看到個(gè)人的加工方法,很多時(shí)候會(huì)有一些不局限性,比如說文本的特征,通過一些方法或者通過不同時(shí)間維度的方法,可以描繪出幾百個(gè)維度的特征,但是不可能達(dá)到完備的狀態(tài),我們確實(shí)需要借助技術(shù)本身的能力達(dá)到提升。
氪信在小額信用貸的場景里面,嘗試用深度學(xué)習(xí)像循環(huán)神經(jīng)網(wǎng)絡(luò)處理時(shí)序的數(shù)據(jù)一樣處理文本,效果還是非常不錯(cuò)的,我們整個(gè)的特征過程是包含了
專家的部分以及深度學(xué)習(xí)自動(dòng)生成的特征共同傳遞給模型,并且進(jìn)行了最終的預(yù)測和識別。 這邊舉一個(gè)具體的例子,剛才我提到時(shí)序的特征。比如我在不同的時(shí)間窗口,是不是要窮盡所有的特征?有可能我們花費(fèi)了大量的時(shí)間,只可以覆蓋80%的部分,但是我們用循環(huán)神經(jīng)網(wǎng)絡(luò)利用長短時(shí)記憶的特征,可以捕捉數(shù)據(jù)在不同窗口趨勢類、統(tǒng)計(jì)類等不同的特征,從而衍生出來上萬種特征,最后我們把這些交給模型,讓它來識別哪些是有效的。
建模部分。我們曾做過很多相關(guān)的實(shí)踐,像淺層的偏現(xiàn)金的模式,有它的優(yōu)勢,比較穩(wěn)定,人也好理解。也嘗試過中間階段端到端的深度學(xué)習(xí)的方法,通過反神經(jīng)網(wǎng)絡(luò)的方法捕捉之間的關(guān)聯(lián)。
最后通過實(shí)踐結(jié)果,我們認(rèn)為集成模型在金融風(fēng)控場景里,是一個(gè)判斷好壞既穩(wěn)定又有效的手段。集成模型的思想是用不同的子分類器,處理不同的數(shù)據(jù)。我會(huì)選擇最好的分類器處理面臨的數(shù)據(jù),在上面去做一個(gè)集成,優(yōu)勢就出來了,就是好而不同,說的直白一點(diǎn)就是三個(gè)臭皮匠頂個(gè)諸葛亮。從模型性能來看,集成方法無論是擬合能力、模型的預(yù)測能力,以及換一個(gè)場景它的穩(wěn)定能力都是非常好的。同時(shí),集成模型在各個(gè)場景里也可以實(shí)現(xiàn)遷移?,F(xiàn)在在氪信的產(chǎn)品體系里面,也融合了這個(gè)方法。
在信用貸場景里面,我們和傳統(tǒng)模型相比性能提升了1倍,穩(wěn)定在KS值0.3以上,壞賬率直接下降46%。這使得我們很興奮,是技術(shù)給業(yè)務(wù)直接帶來了效果。
氪信要做的就是把AI技術(shù)加到金融風(fēng)控里面,而這個(gè)領(lǐng)域里面還是有很多事情可以做的。我們在實(shí)踐的過程中,同時(shí)把方法形成一套產(chǎn)品體系,幫助金融機(jī)構(gòu)解決問題。我們氪信有相應(yīng)的云數(shù)據(jù)的服務(wù),有機(jī)器學(xué)習(xí)建模平臺,有在線風(fēng)控引擎,可以幫助完成企業(yè)互聯(lián)網(wǎng)+的升級。 數(shù)據(jù)核心是我們沉淀的這條金融圖譜的知識體系,從原始的需要用什么數(shù)據(jù),到加工挖掘數(shù)據(jù),再到上層怎么連接管理它,形成精準(zhǔn)完備的畫像。
另外在系統(tǒng)的整個(gè)過程和AI的運(yùn)營中,從設(shè)備接入到數(shù)據(jù)的加工處理,到得出結(jié)果等等,整個(gè)都是自動(dòng)化的過程?,F(xiàn)在現(xiàn)金貸的量非常大,解放人力已經(jīng)成為重要需求,因此我們確確實(shí)實(shí)需要這樣一套數(shù)據(jù)智能一體化的產(chǎn)品。