政府使用大數(shù)據(jù)是為了提升和改善公共服務(wù),這與企業(yè)利用其追求利潤異曲同工。
大數(shù)據(jù)是從各種各樣來源中搜集得到的海量數(shù)據(jù)信息的總稱。對于傳統(tǒng)的關(guān)系型數(shù)據(jù)分析技術(shù)來說,其數(shù)據(jù)量太大,未經(jīng)處理,同時也是非結(jié)構(gòu)化的。據(jù)統(tǒng)計,現(xiàn)在每天產(chǎn)生2.5艾字節(jié)(quintillion bytes)的數(shù)據(jù)信息,全球?qū)⒔?0%的數(shù)據(jù)是過去兩年創(chuàng)造出來的。
此外,從大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)看,大約90%的數(shù)據(jù)是非結(jié)構(gòu)化的。來源于網(wǎng)絡(luò)和云的海量數(shù)據(jù),為發(fā)現(xiàn)、創(chuàng)造價值,以及豐富商業(yè)智能支撐機構(gòu)決策提供了新的機遇。不過,大數(shù)據(jù)也面臨復(fù)雜性、安全和隱私風(fēng)險等新挑戰(zhàn)。同時,對于新技術(shù)和人類技能的開發(fā)來說,大數(shù)據(jù)是一種需要。
大數(shù)據(jù)重新定義了數(shù)據(jù)管理的范圍,由數(shù)據(jù)提取、轉(zhuǎn)換、加載,或稱為ETL(Extraction-Transformation-Loading),演變?yōu)樵诖髷?shù)據(jù)應(yīng)用中凈化和組織非結(jié)構(gòu)化數(shù)據(jù)的新技術(shù)(如分布式架構(gòu)技術(shù))。
盡管企業(yè)部門正引導(dǎo)大數(shù)據(jù)應(yīng)用的發(fā)展,公共部門也開始對迅速增長的大數(shù)據(jù)具有洞察力,為實時決策提供幫助和支持。
大數(shù)據(jù)有多個來源,包括互聯(lián)網(wǎng)、生物和產(chǎn)業(yè)部門、視頻、電子郵件和社交媒體。許多白皮書、期刊論文和商業(yè)報告已經(jīng)提出了政府利用大數(shù)據(jù),幫助其服務(wù)公眾和應(yīng)對傳統(tǒng)挑戰(zhàn)(如醫(yī)療成本上升、創(chuàng)造就業(yè)、自然災(zāi)害和恐怖主義等)的路徑。
也有一些觀點,就大數(shù)據(jù)是否真能改進(jìn)政府運作效率提出質(zhì)疑,因為政府必須發(fā)展新的能力,并采用新技術(shù)(比如分布式和非結(jié)構(gòu)化查詢語言),通過數(shù)據(jù)組織和分析,將大數(shù)據(jù)轉(zhuǎn)變?yōu)橛杏玫男畔ⅰ?/p>
本文就政府是否能與企業(yè)一樣,將大數(shù)據(jù)應(yīng)用于公共服務(wù)部門進(jìn)行了研究。我們首先比較了政府和企業(yè)在目標(biāo)、任務(wù)、決策制定過程、決策者、組織架構(gòu)和戰(zhàn)略的差異,接著考察了部分技術(shù)領(lǐng)先的國家當(dāng)前大數(shù)據(jù)應(yīng)用的狀況,這些國家包括澳大利亞、日本、新加坡、韓國、英國和美國等。
本文也分析了一些企業(yè)的大數(shù)據(jù)應(yīng)用,這些技術(shù)也能應(yīng)用在政府事務(wù)中。最后,我們提出了國家和政府部門未來建設(shè)大數(shù)據(jù)戰(zhàn)略應(yīng)用項目的建議。
文章主要觀點
企業(yè)、政府和研究機構(gòu)都能夠從他們搜集的海量大數(shù)據(jù)中獲取價值;
大數(shù)據(jù)應(yīng)用領(lǐng)先的國家已實施大數(shù)據(jù)應(yīng)用項目,以提高國家運行效率、透明度、民眾福利和公共事務(wù)參與度,確保經(jīng)濟增長和國家安全;
分析政府部門采用的大數(shù)據(jù)應(yīng)用項目,為其他國家提供未來大數(shù)據(jù)行動的引導(dǎo)。
企業(yè)和政府的比較
雖然企業(yè)和政府的主要任務(wù)并不沖突,但各自的舉措具有不同的目標(biāo)和價值。企業(yè)的主要目標(biāo)是通過提供產(chǎn)品和服務(wù)獲取利潤,發(fā)展或維持自身的競爭優(yōu)勢,創(chuàng)造令消費者和其他利益相關(guān)者滿意的價值。政府的主要目標(biāo)則是維持國內(nèi)穩(wěn)定,實現(xiàn)可持續(xù)發(fā)展,確保公民的基本權(quán)利,改善國民福利和促進(jìn)經(jīng)濟增長。
在競爭的市場環(huán)境下,大部分企業(yè)著眼于制定短期決策,并且執(zhí)行人員數(shù)量也很有限。而政府的決策制定過程通常需要更長的時間,經(jīng)過不同群體(包括官員、利益集團和普通民眾)反復(fù)討論和磋商,在彼此間達(dá)成一致后才能有最終結(jié)果。因此,政府制定決策要完成很多程序性步驟,以降低決策風(fēng)險,提高決策效率和確保其效果。由此看來,大數(shù)據(jù)在政府部門和私有部門的應(yīng)用具有很大不同。
數(shù)據(jù)集屬性比較
大數(shù)據(jù)環(huán)境是以信息技術(shù)為基礎(chǔ)的決策支持系統(tǒng)的演進(jìn):從上世紀(jì)60年代的數(shù)據(jù)處理,到70-80年代的信息應(yīng)用,再到90年代的決策支持模型,進(jìn)入2000年后的數(shù)據(jù)存儲和挖掘,再就是今天的大數(shù)據(jù)。大部分與大數(shù)據(jù)相關(guān)的技術(shù)和分析應(yīng)用是從2010年左右開始出現(xiàn)的,故大數(shù)據(jù)時代正處于早期階段/發(fā)展初期。
大數(shù)據(jù)的屬性和挑戰(zhàn)已經(jīng)用3V來描述:海量(volume)、速度(velocity)和多樣性(variety)。海量是大數(shù)據(jù)的基本屬性,各類機構(gòu)和組織在業(yè)務(wù)活動過程中產(chǎn)生數(shù)以百萬億字節(jié)的數(shù)據(jù),數(shù)據(jù)容量越來越大。速度是指數(shù)據(jù)量增長越來越快,對處理速度和響應(yīng)速度提出更高要求,運用傳統(tǒng)的信息技術(shù)手段難以有效處理,以及從中提取有價值的信息。多樣性是指數(shù)據(jù)以各種各樣類型的出現(xiàn),包括結(jié)構(gòu)化的(SQL等傳統(tǒng)的數(shù)據(jù)庫);半結(jié)構(gòu)化的(具有關(guān)鍵字和規(guī)則,但數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整)和非結(jié)構(gòu)化的(非組織性的數(shù)據(jù),沒有商業(yè)智能)。