在“2013中關(guān)村大數(shù)據(jù)日”的大數(shù)據(jù)互聯(lián)網(wǎng)金融論壇上,天云大數(shù)據(jù)馮大志帶來“大數(shù)據(jù)與金融創(chuàng)新”的主題演講。
馮大志:大家下午好!非常高興能有機(jī)會與大家探討一下大數(shù)據(jù)對我們金融行業(yè)的幫助。我非常同意劉處長說的一句話,只有行業(yè)的大數(shù)據(jù),而不是說我通過一個大數(shù)據(jù)去產(chǎn)生一個新的行業(yè)來。所以,我們看從天云這個角度來看的話,之前我們的產(chǎn)品發(fā)布大家也都理解,我們希望幫助企業(yè)共同成長,解決企業(yè)遇到的問題。
按照我們在做大數(shù)據(jù)的時候發(fā)現(xiàn)其實大數(shù)據(jù)從我們一個想法到我們怎么把它落地,面臨著很多的問題。我在來到天云之前,做了6-7年的企業(yè)級倉庫的建設(shè),里面遇到了非常多的問題和挑戰(zhàn),我想今天從另外一個角度來講,我們說大數(shù)據(jù)怎么能夠既把它的平臺優(yōu)勢發(fā)揮出來,幫助我們?nèi)ソ鉀Q一些問題,同時它的算法讓成本優(yōu)勢怎么在金融中去體現(xiàn)出來,下面是我講的一些主要的方式。
大數(shù)據(jù)包括現(xiàn)在互聯(lián)網(wǎng)的一些發(fā)展,給我們帶來的一個最大變化就是個性化,現(xiàn)在越來越強烈了。金融是一個傳統(tǒng)的信息產(chǎn)業(yè),我怎么能夠從這個信息里面更好的為客戶服務(wù),這是我們前些年包括金融的一種信息化、互聯(lián)網(wǎng)化,包括電子銀行、網(wǎng)上支付發(fā)展這么長時間之后逐漸積累下來的,形成了這么多的效果。
現(xiàn)在互聯(lián)網(wǎng),尤其是移動互聯(lián)不斷發(fā)展的今天,我們發(fā)現(xiàn)在一定程度上金融門檻降低了,很多的企業(yè)當(dāng)他有了一定的門檻之后,他可以在非常長的時間里面切下來一塊。如果我們現(xiàn)在做一個特別簡單的轉(zhuǎn)帳交易,包含了轉(zhuǎn)帳前、轉(zhuǎn)帳中、你的交易、結(jié)算清算,包括轉(zhuǎn)帳后會有很多的數(shù)據(jù)在產(chǎn)業(yè)鏈條中留下來。所以,我們在金融里面就講另外一個東西,剛才劉處長也提到了,如何能夠在這樣一個大的鏈條里面快速的實現(xiàn)信息的融合,并反饋到每一個前端的交易甚至操作中,能夠?qū)崿F(xiàn)我們整個金融的快速反饋和構(gòu)建。第三個挑戰(zhàn)就是連接,我們?yōu)槭裁搓P(guān)注于移動互聯(lián)網(wǎng),為什么移動互聯(lián)網(wǎng)的熱度遠(yuǎn)遠(yuǎn)超過傳統(tǒng)互聯(lián)網(wǎng),實際上人是一個有感情的,他是一個社會化的動物,他希望在任何時候、任何過程當(dāng)中大家都聯(lián)系在一起,能夠滿足他的情感需求。現(xiàn)在很多金融行業(yè)里面,包括保險公司也好,包括傳統(tǒng)的金融行業(yè),它在不斷的建立自己跟客戶之間溝通的管道,這種管道的建立更多是以手機(jī)APP形式存在。所以,從現(xiàn)在大數(shù)據(jù)的角度來看,當(dāng)然大數(shù)據(jù)背后代表了很多的技術(shù),我個人覺得我們金融行業(yè)未來的發(fā)展就是個性化和反饋。
大數(shù)據(jù)剛才講了很多的方向和趨勢,但是我覺得大數(shù)據(jù)對傳統(tǒng)的金融行業(yè)來講,其實是有兩個特別重要的一個方向。當(dāng)然,這里面我列了一個,其中這個叫分析的可擴(kuò)展性,如果大家做傳統(tǒng)的數(shù)據(jù)挖掘時一定深有體會,傳統(tǒng)的挖掘怎么做?我們需要有非常多、非常好的博士,包括一些算法的工程師,我需要從傳統(tǒng)的數(shù)據(jù)倉庫里面去抽樣一些數(shù)據(jù)來,去不斷的優(yōu)化算法,反饋到數(shù)據(jù)倉庫里驗證算法,所以整個算法的周期和準(zhǔn)確度很大程度上依賴這些工程師的能力,而且依賴于你的抽樣、采樣數(shù)據(jù)到底多大程度上代表了你這個企業(yè)客戶的貢獻(xiàn),這是傳統(tǒng)的方式。
當(dāng)你的數(shù)據(jù)分析從一百萬拓展到一千萬,有可能算法的復(fù)雜度會從一個簡單的1到2的區(qū)別發(fā)生一個質(zhì)的上升。這樣的話,我們轉(zhuǎn)而通過VI,通過一些統(tǒng)計分析,通過制定幾百個圍度的指標(biāo)來衡量客戶。但是大數(shù)據(jù)通過它的計算能力,這種分布式的計算能力能夠在一定程度上實現(xiàn)非常多算法的分布式計算能力,就像我這里提到的,我們在給一個公司去做測算的時候,我們有3600萬的存量客戶,在我們的系統(tǒng)上大概20分鐘跑完。但是傳統(tǒng)的體系架構(gòu)下,一千萬客戶已經(jīng)很難做分析了,這樣帶給客戶一個最大的好處是什么?我知道任何分析的結(jié)果就是一個事實,這個事實就可以直接用來指導(dǎo)對策,這就是大數(shù)據(jù)可擴(kuò)展的分析能力帶來的好處。另外一個,就是大數(shù)據(jù)對于傳統(tǒng)數(shù)據(jù)的清洗、數(shù)據(jù)的質(zhì)量轉(zhuǎn)換、數(shù)據(jù)的治理,在很多層面,大數(shù)據(jù)可以做非常多的事情。對于傳統(tǒng)的企業(yè)有什么好處呢?提升我們時間的處理效率。
這張圖我們看到,我們通過一個非常簡單的實驗算法,在傳統(tǒng)的分析里,需要對這個算法做實驗,從這里面我們可以看到,進(jìn)行一個簡單的分析的話,我們就知道年收入大概在多少時大概對企業(yè)的貢獻(xiàn)率是最好的,并不是年收入越高對企業(yè)的貢獻(xiàn)就越大,而是年收入在2萬多、4萬多,有可能是二三線城市的普通員工,普通城市的市民可能更希望到我的這個保險公司來買保險。這些規(guī)定其實就是大數(shù)據(jù)通過一個算法能夠發(fā)現(xiàn)出來一些規(guī)律,再把我們沒有預(yù)先干預(yù)的規(guī)律反饋到我們實際的數(shù)據(jù)倉庫作為一個指導(dǎo)。因為我知道這東西得出來的結(jié)果是一個事實存在的結(jié)果,并不是我通過算法預(yù)測出來的,也不是我通過很多的手段模擬出來的,而是實時存在的,所以它有快速的分析帶來了一個非??斓姆答?。
另外一塊我剛才提到了,我們在整個金融行業(yè)里包含了兩大類數(shù)據(jù),第一類是金融業(yè)的內(nèi)部數(shù)據(jù)。隨著銀行IT的建設(shè)不斷完善,每一個業(yè)務(wù)在銀行里面都已經(jīng)做得非常精細(xì)了,而且也非常完善,但是這也帶來另外一個問題,就是數(shù)據(jù)分布在企業(yè)的不同部門和不同角落里面,甚至有些數(shù)據(jù)存在,但是很多人都不知道這個數(shù)據(jù)就在那。這樣的話就帶來什么呢?如何在金融企業(yè)內(nèi)部去實現(xiàn)數(shù)據(jù)的融合,去更大程度的發(fā)揮這個數(shù)據(jù)的價值,這一塊在很多的企業(yè)里面,不管是金融,剛才劉處長也提到了,我們在廣電行業(yè)也實現(xiàn)了的業(yè)務(wù)數(shù)據(jù)的融合,結(jié)構(gòu)化和非結(jié)構(gòu)化,這是我講的內(nèi)部數(shù)據(jù)的融合問題。
另外大數(shù)據(jù)還有一個好處是什么呢?它的這種數(shù)據(jù)庫的數(shù)據(jù)存儲模式更適合于把結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)合在一起統(tǒng)一進(jìn)行需求分析。剛才我們在下的時候,有一個客戶跟我討論,他特別關(guān)注的一個點就是如何把非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,他為什么提這個觀點呢?他認(rèn)為現(xiàn)在企業(yè)里存在大量的非結(jié)構(gòu)化數(shù)據(jù),他需要對這些數(shù)據(jù)進(jìn)行分析。我跟他說,非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化,我們能提供一個算法能力和工具,真正如何把非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,讓它不失真、真實的反映企業(yè)的情況,這也是需要行業(yè)一起努力的,這也是我們在做大數(shù)據(jù)時希望合作方跟我們一起來做大這個產(chǎn)業(yè),共同發(fā)展。
第三塊,我覺得大數(shù)據(jù)在企業(yè)里最重要的特點就是品牌建設(shè)。我們現(xiàn)在做的比較多的是輿情方面的監(jiān)控,包括品牌印象,這個品牌印象包含了比如說光大,我們談到最多的理財,因為它是以理財為基礎(chǔ)的吸引客戶特別專業(yè)的一個銀行。但是,同樣是一個企業(yè)的全國的形象,在不同的省份里表現(xiàn)是不同的,你在西南邊陲的一個重慶市,可能大家對光大的印象跟企業(yè)的宣傳形象是完全不一樣的,我怎么能夠讓一個總部的決策直接一竿子插到底插到基層,讓每個人都知道在這個地區(qū)里面大家對你的印象是什么,大家對你競爭對手的印象是什么。所以,這樣的話,我們需要用大數(shù)據(jù),通過其他技術(shù)也好,我們能夠去實現(xiàn)這種輿情方面的監(jiān)控,把原來我們只是感覺到大家的一種感覺把它量化出來,這是大數(shù)據(jù)在金融里面另外一個應(yīng)用的方式。
第三塊是業(yè)務(wù)拓展,一個是完善,另外一個是引入。完善是如何能夠去完善現(xiàn)有的體系,剛才雷總也提到了,現(xiàn)在我們信用評估體系已經(jīng)很成形了,沒有人能夠去顛覆,破壞性創(chuàng)新這樣一個體系,但是我們可以在此基礎(chǔ)之上,通過客戶的方式引入一個圍度,能夠把這個體系完善一點。還有一個思路是引入數(shù)據(jù),什么叫引入數(shù)據(jù)?現(xiàn)在很多銀行在做互聯(lián)網(wǎng)金融,在做供應(yīng)鏈金融,他為什么要做這個?因為他發(fā)現(xiàn)當(dāng)你引入一個新的行業(yè),它有產(chǎn)業(yè)上下游數(shù)據(jù)之后,你可以做更多的數(shù)據(jù),可以精準(zhǔn)的刻畫一個人,更精準(zhǔn)的去描述一個問題,或者說更好的看待一個趨勢,這就是金融行業(yè)里面現(xiàn)在面臨的很多問題,在這里面,大家他們談到了很多的互聯(lián)網(wǎng)金融、供應(yīng)鏈金融,現(xiàn)在還談到銀行,其實本質(zhì)在于如何合理的引入一個數(shù)據(jù)源,更好的解決我們未來銀行體系的發(fā)展。
上面一塊我們講的是銀行對于金融行業(yè)來講如何更好的為我們的客戶提供服務(wù),這樣的話,其實有非常多的方式,讓我們既有了新的數(shù)據(jù)源,我們又能夠知道在銀行里面,在網(wǎng)上銀行,每一筆操作能夠通過分析更好的解決客戶到底想要什么,他能夠?qū)崿F(xiàn)什么樣的目的,他想買什么樣的產(chǎn)品,包括劉處也談到了跟很多企業(yè)在合作,其實就是想解決如何更好的為客戶服務(wù),金融競爭越來越厲害時,我覺得銀行的形象不再是大而全的銀行,而是專注某一個行業(yè)的銀行。
下面我們談到的一塊是我們正在做一個嘗試,能夠把一些分散在互聯(lián)網(wǎng)上的碎片化的零散信息捕捉到,而且能夠把它量化出來,實現(xiàn)對企業(yè)價值的分析。這樣的話,其實對于銀行來講,他有很多可控的可操作的負(fù)面控制,比如說金融危機(jī)來的時候,這個企業(yè)已經(jīng)倒閉了,但是企業(yè)所有的信用狀況在銀行里是完好的。在金融危機(jī)爆發(fā)的時候,歐洲有一家銀行就犯了一個低級錯誤,他的客戶已經(jīng)快倒閉了,但是他還貸給客戶錢。我們希望在明年,我們的一些項目能夠幫助一些企業(yè)去實現(xiàn)金融行業(yè)的落地。
以上就是我談到的我們從天云角度,從我們算法的角度對金融創(chuàng)新的理解,非常感謝大家,謝謝!