數(shù)據(jù)的真實價值就像漂浮在海洋中冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。在大數(shù)據(jù)時代,數(shù)據(jù)的價值仍然存在,只是處于“休眠”狀態(tài),而要解鎖這些數(shù)據(jù)的價值,就必須通過統(tǒng)計人員的不懈努力并借助新一代的方法和工具,來釋放數(shù)據(jù)隱藏的價值。
大數(shù)據(jù)來襲勢不可擋
世界每時每刻都在產(chǎn)生數(shù)據(jù),數(shù)據(jù)又開始以幾何級增長,這種增長速度已經(jīng)不是“爆炸”二字可以形容的了。國際數(shù)據(jù)公司(IDC)的《數(shù)據(jù)宇宙》報告顯示:2008年全球數(shù)據(jù)量為0.5ZB,2010年為1.2ZB,人類正式進(jìn)入ZB時代。更為驚人的是,2020年以前全球數(shù)據(jù)量仍將保持每年40%以上的高速增長,大約每兩年就翻一倍,預(yù)計2020年將突破35ZB。
任何事物量變到一定程度必然要發(fā)生質(zhì)變。哈佛大學(xué)里·金教授說:“大數(shù)據(jù)是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商業(yè)還是政府,所有領(lǐng)域都將開始這種進(jìn)程。”今天,我們進(jìn)入了信息社會,面臨著大數(shù)據(jù)時代的來臨,云計算、物聯(lián)網(wǎng)、移動終端及可穿戴設(shè)備高度發(fā)達(dá)與融合,不管你是誰、不管你愿意不愿意,都要與數(shù)據(jù)打交道,要么在生產(chǎn)數(shù)據(jù),要么在接收數(shù)據(jù)。大數(shù)據(jù)能輕而易舉地解決常規(guī)統(tǒng)計調(diào)查無法涉及到的、各種復(fù)雜多變的行業(yè)和領(lǐng)域的統(tǒng)計,因為大數(shù)據(jù)不但量大,其涵蓋面也十分廣泛,任何時候、地方、人或單位,只要發(fā)生了互動行為就要留下“痕跡”,而如何在各種各樣的數(shù)據(jù)中進(jìn)行深入的分析和挖掘,發(fā)現(xiàn)這些數(shù)據(jù)當(dāng)中隱藏的更深刻的規(guī)律和現(xiàn)象,對這些信息進(jìn)行加工整理獲得的大數(shù)據(jù),必然能夠有效解決現(xiàn)行統(tǒng)計和國民經(jīng)濟(jì)核算資料不全的問題,更好地服務(wù)于政府決策和社會各方面的需求。
有效利用大數(shù)據(jù)資源
實現(xiàn)數(shù)據(jù)共享。除統(tǒng)計部門外的其他政府部門也積累了海量的數(shù)據(jù)和行政記錄,由于數(shù)據(jù)開放程度不足,大量的政府?dāng)?shù)據(jù)處于“休眠”狀態(tài),而且政府和公共部門是最大的信息數(shù)據(jù)生產(chǎn)、收集、使用和發(fā)布的單位。但現(xiàn)實情況是,海量的數(shù)據(jù)分散在各個部門、各個層級,彼此分割,形成一個個“信息孤島”。城市中不同單位之間的數(shù)據(jù)流通往往是以紙質(zhì)文件形式進(jìn)行的,數(shù)據(jù)的存儲也是以電子文檔的形式和紙質(zhì)文檔的形式進(jìn)行,而且不同城市之間的數(shù)據(jù)交流并不是很方便,一般是孤立的,之間沒有共享的網(wǎng)絡(luò)平臺,是一座座“數(shù)據(jù)孤島”。這就給大數(shù)據(jù)的實現(xiàn)帶來很大阻礙,尤其針對基層統(tǒng)計分析人員來說,給數(shù)據(jù)的全面搜集帶來很大阻力,不得不停留在小數(shù)據(jù)分析時代。因此,要實現(xiàn)大數(shù)據(jù)在統(tǒng)計上的應(yīng)用,必須打破信息之間“壁壘”,真正實現(xiàn)信息資源共享。只有這樣,才能夠最大限度地滿足常規(guī)統(tǒng)計、尤其是國民經(jīng)濟(jì)核算的數(shù)據(jù)需求。
制定統(tǒng)一的標(biāo)準(zhǔn)。首先統(tǒng)計是一門科學(xué),是一項十分嚴(yán)謹(jǐn)?shù)墓ぷ?。因此,統(tǒng)計指標(biāo)的含義、口徑、范圍、來源渠道、計算方法、計量單位等應(yīng)該統(tǒng)一,只有這樣才具有可比性。比如,在大數(shù)據(jù)背景下,如果能有效獲取大型超市、商場、電商歷史銷售明細(xì),將為CPI調(diào)查的小類、基本分類權(quán)重分配提供更具說服力的參考依據(jù)。但是很多食品以千克為單位,而企業(yè)的銷售單位往往是袋、瓶或件。如果折算為千克,需要大量細(xì)致而繁瑣的工作,并且還需要根據(jù)企業(yè)變化而變化,進(jìn)行動態(tài)調(diào)整。數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,指標(biāo)口徑雜亂,數(shù)據(jù)之間就難以整合和銜接,界定哪些信息屬于可在統(tǒng)計上應(yīng)用的大數(shù)據(jù),應(yīng)將大數(shù)據(jù)的口徑、范圍調(diào)整為常規(guī)統(tǒng)計所需的口徑和范圍,對大數(shù)據(jù)的海量信息進(jìn)行甄別、篩選,然后挖掘出統(tǒng)計核算所需要的、且常規(guī)統(tǒng)計所難以取得的資料。其次大數(shù)據(jù)和小數(shù)據(jù)在運用過程中的結(jié)合所需要的理論解釋和技術(shù)手段也都需要創(chuàng)新,這就需要依據(jù)模糊數(shù)學(xué)、統(tǒng)計學(xué)、計量經(jīng)濟(jì)學(xué)等學(xué)科的理論基礎(chǔ),構(gòu)建和完善智能決策系統(tǒng)的理論基礎(chǔ)和理論體系。在這樣的理論基礎(chǔ)上,還要突破技術(shù)上的障礙,實現(xiàn)政府?dāng)?shù)據(jù)交流的網(wǎng)絡(luò)平臺架構(gòu)、網(wǎng)絡(luò)數(shù)據(jù)的安全和保密、數(shù)據(jù)分析和應(yīng)用體系的軟件設(shè)計和完善。同時,傳統(tǒng)的個人信息保護(hù)制度,在大數(shù)據(jù)場景下變得越來越難以操作,為防止泄密,有必要制定一個關(guān)于大數(shù)據(jù)開發(fā)利用的制度,保障個體信息資料的安全。