數(shù)據(jù)湖里面有很多,這后面有很多數(shù)據(jù)“庫”,中間有原始數(shù)據(jù),有一個(gè)目錄,這邊有很多數(shù)據(jù)和IT之間的交互,這邊有很多讀的交互,底下還有很多數(shù)據(jù)治理,數(shù)據(jù)治理是說你的數(shù)據(jù)進(jìn)來什么人可以以什么方式把數(shù)據(jù)存進(jìn)來?什么方式把數(shù)據(jù)提走?以什么方式使用這些數(shù)據(jù)?尤其金融數(shù)據(jù)很敏感,你們構(gòu)建這個(gè)的時(shí)候必須要考慮。
其他跟數(shù)據(jù)進(jìn)來,數(shù)據(jù)怎么清理,還有分析的工具有關(guān),這是架構(gòu)在數(shù)據(jù)之上的,這個(gè)概念知道以后,用什么樣的數(shù)據(jù)和技術(shù),大家可以來考慮。
這個(gè)是在架構(gòu)數(shù)據(jù)庫中間,中間要用大量Cloud或者Hybrid Cloud方式提供服務(wù),使用者可以自服務(wù)的,構(gòu)建一些UI功能讓他在界面上自己編輯,就可以編輯出很多應(yīng)用出來。從描述性分析到診斷性分析到預(yù)測性分析,再到指導(dǎo)性分析。指導(dǎo)性分析它的意思有點(diǎn)開藥方一樣,我已經(jīng)知道你得什么病了,告訴你該吃藥了。這一類分析是我已經(jīng)80%、90%的確定。這個(gè)走勢是這樣的,于是你作為關(guān)注這個(gè)走勢的這些人應(yīng)該做這些事情。
最后一個(gè)是自學(xué)習(xí),最終你構(gòu)建的金融大數(shù)據(jù)中心里面,是在若干個(gè)方面提供服務(wù)的,如果僅僅是玩票,可以在某些領(lǐng)域玩得深一點(diǎn)就可以了,這個(gè)沒有問題。
這是未來可能發(fā)生的,Data Lake和Hybrid Cloud。有的人構(gòu)建了一個(gè)企業(yè)內(nèi)部的數(shù)據(jù)湖,有的人構(gòu)建云中的數(shù)據(jù)湖。從使用者角度來講,既需要云中的,也需要某些企業(yè)內(nèi)部的。這兩者之間對(duì)于后臺(tái)管理來說是一個(gè)蠻大的挑戰(zhàn)。數(shù)據(jù)的擁有人不一樣,數(shù)據(jù)和數(shù)據(jù)之間的標(biāo)準(zhǔn),交互的標(biāo)準(zhǔn)、描述的標(biāo)準(zhǔn)都不一樣,互相之間怎么協(xié)調(diào),是一個(gè)很大的挑戰(zhàn)。從IBM角度來講,我們是站在這兩個(gè)后面來看怎么支撐未來的服務(wù)。
現(xiàn)在所有的東西基本都變成開源了,開源以后商家怎么掙錢成為一個(gè)很大的問題。比方說我們?cè)瓉碣u軟件license的,現(xiàn)在不太好賣了,或者未來越來越賣不動(dòng)。我賣服務(wù),假如我是IBM,做了一堆服務(wù),放到IBM的云里面,舉個(gè)例子,中國的銀行就不會(huì)把它的數(shù)據(jù)放到IBM的云里面,美國銀行可能會(huì),這樣IBM未來的商業(yè)模式在哪里?這也是我們正在探討的一些方向。
這個(gè)數(shù)據(jù)本身,大量的Self-Service是被數(shù)據(jù)分析師需要的。那些投資人對(duì)大家來說是數(shù)據(jù)分析師,用大家的數(shù)據(jù)是指導(dǎo)它進(jìn)行投資。分析師需要一些工具,要把這些工具做得簡單方便,自己配置就能用了,你也可以說,你使用我,找一個(gè)數(shù)據(jù)分析師,專業(yè)的,幫你天天做,這個(gè)可以,有可能是一個(gè)人,有可能是個(gè)小的機(jī)器人,你們朝這個(gè)方向做,建議可以做個(gè)小的機(jī)器人助手,可以做自學(xué)習(xí)、分析。從投資角度來講,這個(gè)分析越全面投資越準(zhǔn)確。數(shù)據(jù)分析人有一個(gè)很大的悖論,很特定的觀點(diǎn),數(shù)據(jù)看得越多、越全面,就越能夠把握住相關(guān)的規(guī)律。從我們的角度來講,到最后的結(jié)果,社交媒體里面的數(shù)據(jù),相關(guān)的新聞報(bào)道、正式媒體里面的數(shù)據(jù),相關(guān)的監(jiān)管機(jī)構(gòu)的數(shù)據(jù)、交易數(shù)據(jù)等,對(duì)大家來說都是非常重要的。
IBM有個(gè)Watson Explorer,本質(zhì)來說從功能上現(xiàn)了大家做的數(shù)據(jù)集,但不是針對(duì)金融做的。不同的數(shù)據(jù)源,不同的數(shù)據(jù)分析報(bào)表,有大量不同的結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),通過自服務(wù)的形式提供出去,這是IBM自己做到的一些東西,但不是特定針對(duì)金融行業(yè)做的。
速記內(nèi)容有刪改。
整理:干貨組、張夢(mèng)
注:本稿件摘自數(shù)據(jù)觀入駐自媒體—數(shù)據(jù)派,轉(zhuǎn)載請(qǐng)注明來源。