建立由信息治理部門主導(dǎo)、以業(yè)務(wù)部門為中心的大數(shù)據(jù)創(chuàng)新立項機制。大數(shù)據(jù)應(yīng)用要求盡量壓縮數(shù)據(jù)分析業(yè)務(wù)鏈條,進一步提高具體業(yè)務(wù)與數(shù)據(jù)分析環(huán)節(jié)結(jié)合的緊密程度,對此,可以探索建立由信息治理部門主導(dǎo)、以業(yè)務(wù)部門為中心的大數(shù)據(jù)創(chuàng)新立項機制。簡言之,就是將數(shù)據(jù)分析師融入具體業(yè)務(wù)部門,由數(shù)據(jù)分析師和具體業(yè)務(wù)部門共同發(fā)起大數(shù)據(jù)應(yīng)用的創(chuàng)新項目立項,經(jīng)信息治理部門審批后,給予相應(yīng)的計算資源,并依據(jù)數(shù)據(jù)應(yīng)用項目在具體業(yè)務(wù)中產(chǎn)生的效果進行評估和激勵。
大數(shù)據(jù)只需要海杜普平臺嗎?
Apache 軟件基金會(ASF)旗下的海杜普(Hadoop)開源項目對于大數(shù)據(jù)應(yīng)用無疑有著巨大的推動作用,基于Hadoop的HDFS系統(tǒng)也是目前主流大數(shù)據(jù)平臺的重要基礎(chǔ)設(shè)施,那么是不是有了Hadoop平臺,商業(yè)銀行就擁有了大數(shù)據(jù)處理能力了呢?
首先,從軟硬件平臺的完備性來看,還需持續(xù)投入,配置更多的軟件模塊,以提升大數(shù)據(jù)分析平臺的能力。Hadoop只是大數(shù)據(jù)分析平臺的基礎(chǔ)設(shè)施,除了基于Hadoop及Yarn的Hive、HBase、Pig、Storm之外,mahout、Hadoop-R、Hadoop-weka等數(shù)據(jù)分析、數(shù)據(jù)挖掘套件對于大數(shù)據(jù)分析也是必不可少的,另外速度更快、性能更高的Spark體系也在互聯(lián)網(wǎng)企業(yè)獲得了成功的應(yīng)用,值得商業(yè)銀行關(guān)注和借鑒。
其次,從數(shù)據(jù)的來源來看,還需改造前端,以獲取更多維度、更高頻次、更細粒度的數(shù)據(jù)。商業(yè)銀行的數(shù)據(jù)分析系統(tǒng)長期以來重視業(yè)務(wù)數(shù)據(jù)的存儲,而對于系統(tǒng)運行狀態(tài)的日志、客戶個人信息的收集并不重視,而這些信息恰恰是大數(shù)據(jù)分析得以理解客戶、排查業(yè)務(wù)問題的關(guān)鍵所在。因此,商業(yè)銀行需要系統(tǒng)性地進行應(yīng)用前端改造,借鑒互聯(lián)網(wǎng)企業(yè)、電商企業(yè)的做法,設(shè)法獲取更多維度、更高頻次、更細粒度的數(shù)據(jù),更好地滿足大數(shù)據(jù)分析對數(shù)據(jù)源的需求。
最后,從項目的執(zhí)行過程來看,還須形成“數(shù)據(jù)分析+業(yè)務(wù)應(yīng)用”的數(shù)據(jù)分析模式,以迭代方式優(yōu)化分析結(jié)果和具體業(yè)務(wù)。傳統(tǒng)的BI模式下,數(shù)據(jù)分析的業(yè)務(wù)流程可以概括為:接受業(yè)務(wù)部門提出的分析需求=>數(shù)據(jù)分析=>形成報告。而大數(shù)據(jù)分析的很多項目需要數(shù)據(jù)分析師與業(yè)務(wù)人員一起進行持續(xù)迭代,有的項目甚至很難確立一個明確的終止時間點(例如電商的推薦系統(tǒng)一般由一個團隊持續(xù)優(yōu)化),這就需要商業(yè)銀行能夠允許在特定的大數(shù)據(jù)分析項目上,采取“數(shù)據(jù)分析+業(yè)務(wù)應(yīng)用”的數(shù)據(jù)分析模式,以迭代方式優(yōu)化分析結(jié)果和具體業(yè)務(wù)。
可見,Hadoop平臺并不是商業(yè)銀行具備大數(shù)據(jù)能力的充要條件,商業(yè)銀行不僅需要在軟硬件平臺上持續(xù)投入,還需要在前端設(shè)計、數(shù)據(jù)分析模式等方面加以改造,才能更加適應(yīng)大數(shù)據(jù)分析的要求。
大數(shù)據(jù)只是數(shù)據(jù)分析部門的事?
如前所述,大數(shù)據(jù)能力是以數(shù)據(jù)分析為基礎(chǔ)的,融合商業(yè)決策、客戶感知、個性化服務(wù)為一體的綜合競爭力,因此,大數(shù)據(jù)能力建設(shè)就不應(yīng)僅由數(shù)據(jù)分析部門來承擔(dān)。
要從戰(zhàn)略層面將大數(shù)據(jù)能力建設(shè)納入發(fā)展規(guī)劃。應(yīng)做好頂層設(shè)計,把大數(shù)據(jù)能力建設(shè)與信息化銀行建設(shè)結(jié)合起來,與線上線下一體化建設(shè)結(jié)合起來,與互聯(lián)網(wǎng)金融發(fā)展戰(zhàn)略結(jié)合起來,協(xié)同業(yè)務(wù)、渠道、科技、數(shù)據(jù)分析等多個部門,做好頂層設(shè)計和統(tǒng)籌規(guī)劃,形成“全員大數(shù)據(jù)”的氛圍,從數(shù)據(jù)源梳理、數(shù)據(jù)分析平臺搭建、分析模式確立、外部數(shù)據(jù)交換規(guī)則等多個層次制定明確的方針與操作標準,加快大數(shù)據(jù)能力建設(shè)的進度。
要重視數(shù)據(jù)分析流程的效率提升。大數(shù)據(jù)分析的效用大小,很大程度上取決于數(shù)據(jù)的活性以及分析結(jié)果投入具體業(yè)務(wù)的速度,因此,要盡可能壓縮傳統(tǒng)BI的業(yè)務(wù)鏈條??稍陔娮忧篮妥灾辣M可能地實現(xiàn)數(shù)據(jù)采集與分析結(jié)果應(yīng)用的一體化(例如,基于客戶個性的產(chǎn)品關(guān)聯(lián)推薦、基于場景的實時定價、自助設(shè)備界面?zhèn)€性化自適應(yīng)等),也可在傳統(tǒng)的BI領(lǐng)域中,應(yīng)用大數(shù)據(jù)的處理模式,以高實時性的中間數(shù)據(jù)層為媒介,建立效率更高、實時性更強、管理者自定義程度更深的商業(yè)智能系統(tǒng),實現(xiàn)商業(yè)報表的實時化、移動化、定制化。
要重視人才儲備和技術(shù)積累。大數(shù)據(jù)技術(shù)的發(fā)展日新月異,數(shù)據(jù)的人才儲備和技術(shù)積累卻不能一蹴而就,需要相當(dāng)力度的持續(xù)投入。人才儲備方面,應(yīng)本著“引進一批,培養(yǎng)一批,儲備一批”的原則,引進一小批高層次技術(shù)人才,通過具體的項目實施,培養(yǎng)大量的存量技術(shù)人員,并通過面向高校和社會的大數(shù)據(jù)技術(shù)競賽、資助開源社區(qū)等方式,形成廣泛而有效的人才儲備。技術(shù)積累方面,應(yīng)按照“開放并包,為我所用”的思路,組成大數(shù)據(jù)預(yù)研團隊,積極開展開源項目的篩選、驗證、吸收工作,沿著“引入并消化大數(shù)據(jù)開源項目—資助大數(shù)據(jù)開源項目—提出并主導(dǎo)大數(shù)據(jù)開源項目”的路徑,不斷強化自身在大數(shù)據(jù)技術(shù)方面的優(yōu)勢,形成自身的核心競爭力。