通過6個(gè)方面對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)進(jìn)行了全生命周期的管理,包括建模、驗(yàn)證、清理、準(zhǔn)入、數(shù)據(jù)地圖和一些規(guī)范。我們的數(shù)據(jù)量比較大,早期上游應(yīng)用比較多,數(shù)據(jù)質(zhì)量比較差,在這里我們通過源數(shù)據(jù)管理,通過平臺(tái)建設(shè)標(biāo)準(zhǔn)的制定和現(xiàn)有數(shù)據(jù)的治理及制度規(guī)范,通過四方面提升數(shù)據(jù)質(zhì)量。我們建立了自己的源數(shù)據(jù)管理,我們對(duì)技術(shù)源數(shù)據(jù)、業(yè)務(wù)源數(shù)據(jù)和管理源數(shù)據(jù)進(jìn)行了統(tǒng)一的管理,同時(shí)我們也建立了技術(shù)源數(shù)據(jù)和業(yè)務(wù)源數(shù)據(jù)之間的血緣關(guān)系,這樣就能通過業(yè)務(wù)的視角能知道從技術(shù)怎么到業(yè)務(wù)。自己建的系統(tǒng),目前大數(shù)據(jù)支持的應(yīng)用,像互聯(lián)網(wǎng)金融、資產(chǎn)負(fù)債、外部監(jiān)管、運(yùn)營分析、客戶關(guān)系等等,有一些我們正在建設(shè)過程中。
應(yīng)用的現(xiàn)狀,我不一一介紹了,我們?cè)诓煌念I(lǐng)域里支持了不同的應(yīng)用。我們?cè)诖髷?shù)據(jù)的建設(shè)中為了體現(xiàn)數(shù)據(jù)的價(jià)值,我們?cè)诜治鐾诰蚍矫孀隽撕芏喙ぷ?,一個(gè)是平臺(tái)建設(shè)方面投入很大力量,我們跟業(yè)務(wù)融合,分別在多個(gè)領(lǐng)域?qū)懗隽?0多份分析報(bào)告,有精準(zhǔn)營銷和業(yè)績價(jià)值等九個(gè)方面都落到不同的應(yīng)用去嘗試實(shí)現(xiàn)。我們培養(yǎng)的人才,對(duì)SaaS、Spack、R語言,熟悉這些算法,對(duì)聚類、分類、回歸、神經(jīng)網(wǎng)絡(luò)等等進(jìn)行了研究,另外建立一套多場景的實(shí)驗(yàn)環(huán)境,流水線式的作業(yè)、組建化的模型集脫拉拽式的服務(wù),使業(yè)務(wù)人員能更快地使用我的系統(tǒng)。多個(gè)技術(shù)對(duì)用戶來講是透明的,用戶要使用的話非常方便。我們展示了非常完整的服務(wù),對(duì)基礎(chǔ)環(huán)境融合,對(duì)資源的管理展現(xiàn)進(jìn)行全覆蓋,部署的模式也是收放自如的,展現(xiàn)也突破了傳統(tǒng)的思維,我們?cè)趫?bào)表展示層面是可交付的、動(dòng)態(tài)的,可以放大縮小,可以按某一列去排序,可以鎖定表頭,不是一個(gè)靜態(tài)的頁面,報(bào)表是可操作的。
通過這部分報(bào)表的操作,我認(rèn)為分析應(yīng)用,一個(gè)是數(shù)據(jù)的可視化,再一個(gè)是邏輯的節(jié)點(diǎn)的快速開發(fā),實(shí)現(xiàn)對(duì)分析型應(yīng)用的快速開發(fā)部署。我們有了基礎(chǔ)的東西,還有一套規(guī)章制度去管理,總體的管理辦法、數(shù)據(jù)準(zhǔn)入規(guī)則、運(yùn)維的細(xì)則、數(shù)據(jù)模型規(guī)則,真正做到了大數(shù)據(jù)的生態(tài)圈。在自主可控上,基礎(chǔ)硬件、基礎(chǔ)軟件、數(shù)據(jù)模型、工具平臺(tái)和制度管理都是自主可控的。
我談一下感悟,大數(shù)據(jù)到底是什么,它是一種技術(shù),是一個(gè)平臺(tái),還是一個(gè)生態(tài)圈?我們?cè)诖髷?shù)據(jù)生態(tài)里共享、復(fù)用和包容是永恒的主題。大數(shù)據(jù)是一種潮流,是一種意識(shí),是一種習(xí)慣。大數(shù)據(jù)也是一場思維的變革,掌握了大數(shù)據(jù),人們從此就有了預(yù)知未來的能力。大數(shù)據(jù)與農(nóng)業(yè)銀行監(jiān)行監(jiān)近,大數(shù)據(jù)建設(shè)只有起點(diǎn),沒有終點(diǎn),我們一直在路上。在國產(chǎn)化的道路上,希望民族工業(yè)無比強(qiáng)大,在國際市場上挺起腰桿,謝謝大家!