幾周前,當(dāng)費(fèi)埃哲(FICO)首席執(zhí)行官William Lansing參加斯坦福大學(xué)有關(guān)大數(shù)據(jù)會議的時候,他發(fā)現(xiàn),業(yè)界關(guān)于大數(shù)據(jù)的熱烈討論已經(jīng)從三個“V”增加到四個“V”,即Volume(數(shù)據(jù)量)、Variety(數(shù)據(jù)類型)、Velocity(處理速度)以及Value(數(shù)據(jù)價值)。而第四個“V”正意味著業(yè)界開始關(guān)注數(shù)據(jù)洞察,強(qiáng)調(diào)如何獲取大數(shù)據(jù)的價值。“挖潛數(shù)據(jù)價值正是FICO成立50余年來一直專注的事。我們的核心業(yè)務(wù)就是分析各種數(shù)據(jù),并做出智能的決策。”Lansing表示,“FICO的市值也在近一年來連續(xù)攀升,如今已經(jīng)達(dá)到15億美元。”
1956年,斯坦福大學(xué)的幾名數(shù)學(xué)專家創(chuàng)立了FICO,公司當(dāng)時的愿景就是希望利用數(shù)據(jù)分析預(yù)測風(fēng)險變量,從而幫助銀行控制信用貸款的規(guī)模。如今,F(xiàn)ICO的分析技術(shù)正保護(hù)著全球2/3的信用卡業(yè)務(wù),僅在美國就幫助各類機(jī)構(gòu)實(shí)現(xiàn)高達(dá)100億美元的審批貸款決策,可見其數(shù)據(jù)分析與預(yù)測技術(shù)的功底。“對我們而言,大數(shù)據(jù)也是大機(jī)會。”Lansing近日來到中國,并與本報記者分享了他對大數(shù)據(jù)的觀點(diǎn)。
數(shù)據(jù)分層的價值
的確,如今大數(shù)據(jù)是個熱門話題,但關(guān)于大數(shù)據(jù)的討論多數(shù)還是圍繞基礎(chǔ)架構(gòu)層面展開,比如Hadoop等技術(shù)。這些討論多集中在數(shù)據(jù)存儲、數(shù)據(jù)處理以及實(shí)時管理等方面。Lansing透露,即使是在硅谷,很多新興企業(yè)也都是專注在大數(shù)據(jù)基礎(chǔ)架構(gòu)領(lǐng)域,比如Cloudera,它能夠?yàn)殚_源技術(shù)提供商業(yè)軟件級別支持,在大數(shù)據(jù)領(lǐng)域,就如紅帽支持Linux一樣,Cloudera 也在支持 Hadoop,議題多圍繞在開發(fā)技術(shù)如何讓大數(shù)據(jù)更易于讀取和存儲。然而,圍繞大數(shù)據(jù)分析的話題還遠(yuǎn)遠(yuǎn)不夠。大家都在討論如何存儲、捕捉大數(shù)據(jù),但卻很少提及客戶究竟可以用這些大數(shù)據(jù)做什么。
其實(shí),無論哪種類型的企業(yè)最關(guān)心的就是價值,這意味著,企業(yè)需要找出大數(shù)據(jù)中最相關(guān)的變量,然后基于這些變量數(shù)據(jù)進(jìn)行建模,并基于模型做出更好的決策。這正是FICO的專長:如果數(shù)據(jù)處理能力無限,我們能不能基于所有數(shù)據(jù)做出更好的決策?我們能夠?yàn)檫@些額外增加的數(shù)據(jù)量花費(fèi)多少資金和精力?這些額外的數(shù)據(jù)對決策是否重要?處理所有數(shù)據(jù)的投入產(chǎn)出比如何?這樣做是否會影響決策速度甚至是準(zhǔn)確度?
這一系列問題的核心就是,數(shù)據(jù)生來就是不等價的。這至少意味著三個關(guān)鍵點(diǎn):一、總有一些數(shù)據(jù)是更重要的數(shù)據(jù),應(yīng)該首先去關(guān)注這些更重要的數(shù)據(jù),并基于這些重要的數(shù)據(jù)去進(jìn)行分析和預(yù)測;二、數(shù)據(jù)的重要性有一個順序,一些數(shù)據(jù)是我們要優(yōu)先采用的數(shù)據(jù),一些可以作為分析預(yù)測的依據(jù);三、與所有的數(shù)據(jù)源相同,大數(shù)據(jù)也難免摻雜著虛假的線索、噪音和干擾,這是數(shù)據(jù)清洗的問題。所以,我們必須要非常智能地來使用這些數(shù)據(jù)。
Lansing認(rèn)為:“數(shù)據(jù)處理是有范圍的,我們會關(guān)注某些數(shù)據(jù)的范圍,基于這些數(shù)據(jù)的范圍來做出決策,找出那些更為實(shí)用的數(shù)據(jù)。因此,今天我們還是需要更關(guān)注于那些有實(shí)用價值的數(shù)據(jù),這樣的數(shù)據(jù)更多的是結(jié)構(gòu)化數(shù)據(jù)。”
舉例來說,銀行機(jī)構(gòu)需要通過所有數(shù)據(jù)了解他們的客戶。這些大數(shù)據(jù)可能包括很多非結(jié)構(gòu)化的數(shù)據(jù),比如文本數(shù)據(jù)、圖像數(shù)據(jù),甚至是Facebook上面的數(shù)據(jù)。如果有一個銀行的客戶經(jīng)常喝醉酒,我們是否可以根據(jù)他醉酒的頻率來進(jìn)行預(yù)測并確定他的信用評分呢?顯然,這些數(shù)據(jù)可能有一定的額外價值,但并非是最實(shí)用的數(shù)據(jù),而且我們還需要考慮在這些額外的瑣碎數(shù)據(jù)上花費(fèi)如此多的精力是否值得。如今,無論是美國還是中國的銀行機(jī)構(gòu),都更關(guān)注實(shí)用的數(shù)據(jù),并且采用那些被經(jīng)驗(yàn)認(rèn)為具有預(yù)測性的數(shù)據(jù)去進(jìn)行分析。這些數(shù)據(jù)可能不見得是大數(shù)據(jù)中的非結(jié)構(gòu)性數(shù)據(jù),但是銀行認(rèn)為它們具有良好的預(yù)測性,可以進(jìn)行分析。
分析方式的改變
大數(shù)據(jù)時代另一個值得關(guān)注的“V”就是Velocity(處理速度),這意味著在大數(shù)據(jù)的處理方面,不能簡單應(yīng)用傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)分析的方式正在發(fā)生改變。Lansing也認(rèn)為,大數(shù)據(jù)時代同樣重要的是速度和效率的提升,客戶正從“分批決策”過渡到“即時決策”。
事實(shí)上,數(shù)據(jù)分析大體有兩種模型,一種是基于假設(shè)的模型,比如說我們要關(guān)注那些高價值的數(shù)據(jù),關(guān)注相關(guān)領(lǐng)域的數(shù)據(jù),關(guān)注那些能夠提升效率的數(shù)據(jù)。
FICO在數(shù)據(jù)流特征分析領(lǐng)域不斷推動創(chuàng)新,尤其是在欺詐防范這一領(lǐng)域。 其反欺詐解決方案模型依靠交易特征,概括了數(shù)據(jù)在交易過程中的特征,以便計算相關(guān)的欺詐特點(diǎn)的變量,而不依賴由此生成的既有數(shù)據(jù)。
另一種模型就是一種非基于假設(shè)的模型。因?yàn)椋纱髷?shù)據(jù)帶來的變化是分析時必須減少對于固有數(shù)據(jù)的依賴,分析模型將能夠根據(jù)數(shù)據(jù)流中的動態(tài)數(shù)據(jù)自我調(diào)整。為了應(yīng)對不斷增加的數(shù)據(jù)流中的動態(tài)數(shù)據(jù),就需要集中研發(fā)自我學(xué)習(xí)的技術(shù),包括自適應(yīng)分析和自我矯正分析技術(shù)。Lansing相信,這些關(guān)鍵技術(shù)將彌補(bǔ)傳統(tǒng)方式的不足,甚至將可能在某些領(lǐng)域取代傳統(tǒng)的模式。
據(jù)悉,現(xiàn)在就已經(jīng)有一些新興銀行在利用FICO的這種自學(xué)習(xí)分析方式進(jìn)行小額貸款。這些貸款并不按照傳統(tǒng)的貸款審批模式,而是針對次貸或一些特定的人群隨機(jī)發(fā)放小額貸款。由于采用系統(tǒng)學(xué)習(xí)的模型方法,小額貸款出現(xiàn)壞賬后,相關(guān)信息將自動輸入系統(tǒng),以供系統(tǒng)學(xué)習(xí),然后再發(fā)放更多的貸款,并不斷重復(fù)進(jìn)行這個自我學(xué)習(xí)的過程。
這一做法只是在一個很窄的人群范圍內(nèi)采用,事實(shí)上很多大型銀行接受這種方式也需要相當(dāng)長的時間。但是不可否認(rèn),這種小額貸款方式可以逐漸補(bǔ)充原有的信貸方式,更好地為客戶提供服務(wù)。
個性與共性
數(shù)據(jù)分析和預(yù)測的技術(shù)有沒有可延展性,即能不能從銀行業(yè)拓展到其他領(lǐng)域呢?實(shí)際上FICO對于客戶行為的了解,不僅僅局限于銀行業(yè),還包括保險業(yè)和零售業(yè),這是因?yàn)榭蛻粜袨閺臄?shù)據(jù)分析角度看具有共性。
Lansing表示:“比如,在保險行業(yè)當(dāng)中的欺詐行為和銀行當(dāng)中的信用卡欺詐的行為是非常相似的。在營銷解決方案方面,很多零售業(yè)的用戶行為和銀行業(yè)的用戶行為也是非常相似的。同樣我們在金融行業(yè)的客戶管理經(jīng)驗(yàn),也可以應(yīng)用到零售行業(yè)。”
FICO擅長于分析一些復(fù)雜、困難的問題,而公司聲譽(yù)也正是基于在金融行業(yè)里的優(yōu)秀表現(xiàn)所建立起來的。因此,F(xiàn)ICO除了開展信用評價為核心的業(yè)務(wù)之外,還開展了應(yīng)用軟件業(yè)務(wù),幫助全球金融機(jī)構(gòu)提供諸如巴塞爾合規(guī)咨詢、賬戶管理系統(tǒng)、反欺詐系統(tǒng)、催收與資產(chǎn)保全系統(tǒng)、信用評分模型和技術(shù)等多方面的產(chǎn)品和服務(wù),為非金融機(jī)構(gòu)提供基于數(shù)據(jù)分析的市場營銷解決方案等,并擴(kuò)展到利用分析工具幫助客戶解決任何分析業(yè)務(wù)方面。
比如在大數(shù)據(jù)方面,可以基于零售分析提出營銷解決方案。如今,零售市場被細(xì)分為很多區(qū)域化市場,逐漸走向精細(xì)化,某一企業(yè)可能會專門針對某一個具體的市場,針對某一特定人群發(fā)送電子郵件、短信甚至明信片,來進(jìn)行個性化的營銷活動。因此,整個零售市場的主要特點(diǎn)就是個性化和活動管理。
例如,一個客戶每六個星期都會到某超市購買某種牌子的洗滌劑,這樣這位客戶下次再來的時候,就是超市為他提供洗滌劑營銷和服務(wù)的最好時機(jī)。
Lansing認(rèn)為,利用數(shù)據(jù)分析,實(shí)現(xiàn)一個單一的細(xì)分市場,應(yīng)該是營銷的未來發(fā)展趨勢,而對于銀行業(yè)來說,一對一的營銷能力同樣被看重。為此,今年5月FICO還收購了Entiera公司,更好地支持FICO為銀行和零售行業(yè)客戶提供一對一營銷的解決方案。據(jù)悉,Entiera公司獨(dú)特的客戶對話管理解決方案可以幫助企業(yè)在SaaS環(huán)境中生成、監(jiān)控和分析營銷解決方案,還可以存儲非結(jié)構(gòu)化的數(shù)據(jù),讓營銷方案和決策更便于操作。