(6)數(shù)據(jù)科學(xué)研究人才
數(shù)據(jù)科學(xué)研究是一個全新的工作,夠?qū)挝?、企業(yè)的數(shù)據(jù)和技術(shù)轉(zhuǎn)化為有用的商業(yè)價值,隨著大數(shù)據(jù)時代的到來,越來越多的工作、事務(wù)直接涉及或針對數(shù)據(jù),這就需要有數(shù)據(jù)科學(xué)方面的研究專家來進行研究,通過研究,他們能將數(shù)據(jù)分析結(jié)果解釋給IT部門和業(yè)務(wù)部門管理者聽,數(shù)據(jù)科學(xué)專家是聯(lián)通海量數(shù)據(jù)和管理者之間的橋梁,需要有數(shù)據(jù)專業(yè)、分析師能力和管理者的知識,這也是搶手的人才。
3、大數(shù)據(jù)行業(yè)的從業(yè)者是從哪獲得數(shù)據(jù)的?
大數(shù)據(jù)行業(yè)的從業(yè)者有多種途徑獲得數(shù)據(jù),也就是我們常說的數(shù)據(jù)源,具體有一下幾種:
(1)官方數(shù)據(jù)(政府部門或企業(yè)直接提供的數(shù)據(jù)或數(shù)據(jù)接口);
(2)半官方數(shù)據(jù):如各類行業(yè)協(xié)會,俱樂部;
(3)各個平臺的數(shù)據(jù):如淘寶網(wǎng)、京東、唯品會,有些會免費開發(fā)數(shù)據(jù),還有一部分是付費的數(shù)據(jù)軟件;
(4)再然后就是從業(yè)者自己收集的數(shù)據(jù),一般都是用一些數(shù)據(jù)采集工具或軟件,工具如:爬蟲軟件,百度蜘蛛等;
(5)最后就是購買的數(shù)據(jù),一般有一些專門數(shù)據(jù)采集的機構(gòu),像像艾瑞、浪潮,以及傳統(tǒng)的調(diào)研企業(yè)。
數(shù)據(jù)的獲取方式有很多種,同樣,數(shù)據(jù)的使用方式也有很多種,比如說行業(yè)銷售趨勢,有人用銷售額數(shù)據(jù),有人用銷量數(shù)據(jù)。數(shù)據(jù)就像一個任人打扮的姑娘,使用的人會選取自己想要的數(shù)據(jù)來展示,所以考量數(shù)據(jù)的真實性,一個是數(shù)據(jù)來源,還有就是數(shù)據(jù)的選擇是否合理。
4、大數(shù)據(jù)分析的常用方法有哪些?
(1)Analytic Visualizations(可視化分析)
不管是對數(shù)據(jù)分析專家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求。可視化可以直觀的展示數(shù)據(jù),讓數(shù)據(jù)自己說話,讓觀眾聽到結(jié)果。
(2)Data Mining Algorithms(數(shù)據(jù)挖掘算法)
可視化是給人看的,數(shù)據(jù)挖掘就是給機器看的。集群、分割、孤立點分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部,挖掘價值。這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。
(3)Predictive Analytic Capabilities(預(yù)測性分析能力)
數(shù)據(jù)挖掘可以讓分析員更好的理解數(shù)據(jù),而預(yù)測性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出一些預(yù)測性的判斷。
(4)Semantic Engines(語義引擎)
由于非結(jié)構(gòu)化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新的挑戰(zhàn),需要一系列的工具去解析,提取,分析數(shù)據(jù)。語義引擎需要被設(shè)計成能夠從“文檔”中智能提取信息。
(5)Data Quality and Master Data Management(數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理)
數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的最佳實踐。通過標(biāo)準(zhǔn)化的流程和工具對數(shù)據(jù)進行處理可以保證一個預(yù)先定義好的高質(zhì)量的分析結(jié)果。
5、央行征信和大數(shù)據(jù)征信的不同之處
(1)確實有不同之處,央行征信是傳統(tǒng)征信方式,大數(shù)據(jù)征信是伴隨互聯(lián)網(wǎng)金融發(fā)展起來的。
(2)央行征信與大數(shù)據(jù)征信差異主要從征信數(shù)據(jù)來源、權(quán)威性、數(shù)據(jù)完整性、用途等維度區(qū)分。
(3)央行征信特點:數(shù)據(jù)主要來自銀行、證券、保險、社保等體系里構(gòu)成一個數(shù)據(jù)循環(huán),權(quán)威性高,數(shù)據(jù)基本完整,主要用于資產(chǎn)評估、銀行放貸、信用卡額度等。
(4)大數(shù)據(jù)征信特點:數(shù)據(jù)主要來自互聯(lián)網(wǎng)各大平臺,使用互聯(lián)網(wǎng)技術(shù)抓取或接口合作獲取征信數(shù)據(jù),資質(zhì)再好一點的企業(yè)可以申請接入央行征信,權(quán)威性不如央行征信,但隨著互聯(lián)網(wǎng)金融的發(fā)展會越來越重要,數(shù)據(jù)完整性各大數(shù)據(jù)征信平臺不同,主要用于互聯(lián)網(wǎng)金融,例如P2P,如果p2p拿不到央行征信數(shù)據(jù)風(fēng)險會很大。
(5)展望未來:隨著互聯(lián)網(wǎng)金融的發(fā)展,大數(shù)據(jù)征信與央行征信會不斷融合直至融為一體,真正的滿足數(shù)據(jù)的完整性,那違法犯罪基本就真的大大減少了,信用真的就是錢!
6、如何構(gòu)建銀行業(yè)大數(shù)據(jù)分析平臺 ?
一是銀行與電商平臺形成戰(zhàn)略合作。銀行業(yè)共享小微企業(yè)在電商平臺上的經(jīng)營數(shù)據(jù)和經(jīng)營者的個人信息,由電商平臺向銀行推薦有貸款意向的優(yōu)質(zhì)企業(yè),銀行通過交易流水、買賣雙方評價等信息,確定企業(yè)資信水平,給予授信額度。建設(shè)銀行曾在這方面做過有益的嘗試。此外也有銀行參股電商、開展數(shù)據(jù)合作的案例。
二是銀行自主搭建電商平臺。銀行自建電商平臺,獲得數(shù)據(jù)資源的獨立話語權(quán)。在為客戶提供增值服務(wù)的同時,獲得客戶的動態(tài)商業(yè)信息,為發(fā)展小微信貸奠定基礎(chǔ),是銀行搭建電商平臺的驅(qū)動力。2012年,建設(shè)銀行率先上線“善融商務(wù)”,提供B2B和B2C客戶操作模式,涵蓋商品批發(fā)、商品零售、房屋交易等領(lǐng)域,為客戶提供信息發(fā)布、交易撮合、社區(qū)服務(wù)、在線財務(wù)管理、在線客服等配套服務(wù),提供的金融服務(wù)已從支付結(jié)算、托管、擔(dān)保擴展到對商戶和消費者線上融資服務(wù)的全過程。