一、人工智能飛速發(fā)展,金融領(lǐng)域大有可為
隨著人工智能技術(shù)的快速發(fā)展,多個領(lǐng)域都迅速收獲了突破性成效,在金融領(lǐng)域內(nèi)也是如此。具體來說,在信用評估、投資和個人財務管理上都有所運用。實際上,金融領(lǐng)域是人工智能適合運用的領(lǐng)域之一,這是因為人工智能技術(shù)的數(shù)據(jù)和算法缺一不可,而運用的領(lǐng)域需要滿足能夠?qū)⒁欢ǖ牧鞒虡藴驶?、模式(pattern)化。
金融領(lǐng)域是跟數(shù)據(jù)大量打交道的領(lǐng)域,全球化的波動導致交易市場瞬息萬變,而智能設(shè)備等傳感器的普及產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù)。金融領(lǐng)域的風險定價正可以利用數(shù)據(jù)和算法進行更高效的評估,可有效的降低金融機構(gòu)的成本,同時挖掘到更多有價值的信息,幫助市場進行決策。
作為全球創(chuàng)新的中心之一——硅谷,近年來也涌現(xiàn)了大量的以人工智能為核心技術(shù)的創(chuàng)業(yè)金融科技公司。未央研究拜訪了這其中16-17年之間成立的公司,以發(fā)現(xiàn)最新人工智能技術(shù)是如何改進或重塑原有金融格局。
二、人工智能技術(shù)在借貸領(lǐng)域的運用
近年來智能設(shè)備的興起圍繞用戶產(chǎn)生了大量的信息,這為評估個人信用風險產(chǎn)生了大量的挖掘價值。同時,傳統(tǒng)的FICO分數(shù)缺陷也一直存在,事實上,由于FICO分數(shù)極大依賴于信用歷史。(FICO分數(shù)考慮的五個指標包括:①償還歷史記錄,占比35%,包括各種信用賬戶的償還信息和負面的公共記錄;②信貸欠款額度,占比30%;③信貸歷史年限,占比15%;④新開設(shè)的信用賬戶,占比10%;⑤正在使用的信用類型,占比10%。)這導致FICO分數(shù)在實際運用中產(chǎn)生了一些問題:
1、對于缺乏信用歷史的人,如移民或者年輕人無法評估;
2、對于已有FICO分數(shù)的人群來說,其假設(shè)和準確性也存疑,例如,如果用戶由于遭受了短期經(jīng)濟打擊失去房子,但是保留工作的車輛則應該判定其有穩(wěn)定的還款意愿,但在FICO分數(shù)里則被認為是不可靠的。而FICO數(shù)據(jù)迭代較慢,這導致了一些分數(shù)較高的用戶同樣存在違約狀況。
近年來,F(xiàn)ICO分數(shù)越來越成為一個供金融機構(gòu)參考而不是決定性的指標之一,對于個人用戶的信息,機構(gòu)會自行收集并用自己的風控模型進行評估。甚至有公司不再使用FICO,例如,2016年1月,硅谷最大的線上貸款公司SoFi就宣布不再使用FICO分數(shù)。
人工智能算法的使用也對于個人用戶信用畫像能起到完善作用。MIT一篇工作論文通過將2009-2012年的消費者信用歷史數(shù)據(jù)和消費類數(shù)據(jù)利用分類和回歸決策樹算法為消費者進行信用分數(shù),并將結(jié)果與利用信用局的數(shù)據(jù)利用傳統(tǒng)方法計算的分數(shù)結(jié)果進行對比。下圖顯示兩種模型對于信用優(yōu)良和信用差的人群都有較好的識別作用,但對于信用中等的人群,前者更能準確的預測該人群的預期行為。
作為近年來發(fā)展最快的深度學習技術(shù)來說,以往可能被信貸員判斷為無關(guān)變量的信息,如地址信息,APP使用習慣等,通過挖掘和整合可能形成有用的變量,從而反映/指向跟用戶的還款意愿或者還款能力相關(guān)的變量。
未央研究在硅谷實地參訪的兩家公司Upgrade和Random Forest Capital都使用了人工智能技術(shù)對于用戶的信用進行了評估——當然前者的方法早已經(jīng)運用在了國內(nèi)。Upgrade自稱推出了評估模型2.0版本,一是使用了地理位置數(shù)據(jù),這些位置數(shù)據(jù)能夠和宏觀經(jīng)濟因素結(jié)合起來,反映了不同地方的經(jīng)濟狀況;二是平臺行為模式是連接到了用戶的checking account,通過分析用戶的自由現(xiàn)金流來看用戶的支付習慣,例如是否由有逾期、懲罰費用,或者錯過了某些支付日期,這種分析方式如同分析中小企業(yè)的現(xiàn)金流的方法。Upgrade將其運用在了個人風控上。
Random Forest Capital在2016成立,是一家位于舊金山的跨平臺機器學習和數(shù)據(jù)工程投資管理公司。Random Forest稱,目前現(xiàn)存的承銷方法昂貴、低效、不準確,無法準確地評估這些債務的風險。Random Forest使用跨平臺的機器學習算法來定價債券;在大大提高準確性和效率的同時,也解決了投資者和借款方的利益沖突。因為平臺獲得的很多數(shù)據(jù)是類別數(shù)據(jù),所以公司使用樹類的模型---基于樹的(tree base)算法很有用,此外Boosting算法也被證明很有效果。