中國IDC圈5月27日報道,隨著我國“互聯(lián)網(wǎng)+”專項行動的實施和國務(wù)院《促進大數(shù)據(jù)發(fā)展行動綱要》的推進,我國大數(shù)據(jù)的體量呈指數(shù)級增長。大數(shù)據(jù)的流通、開放、共享、安全等問題也受到越來越多的關(guān)注。
隨著大數(shù)據(jù)的價值被廣泛認(rèn)可,尤其是政府高層的主動推進,越來越多的企業(yè)加入到該領(lǐng)域中掘金。目前,大數(shù)據(jù)主要在醫(yī)療、消費、金融、公共安全等這幾大非公開領(lǐng)域被討論和研究得較多。目前較少有人關(guān)注公開數(shù)據(jù),其實公開數(shù)據(jù)比私有數(shù)據(jù)具有更大的價值挖掘空間。
一般而言,大數(shù)據(jù)根據(jù)訪問權(quán)限可分為私有數(shù)據(jù)和公開數(shù)據(jù)。很多人認(rèn)為私有數(shù)據(jù)才具有價值,例如銀行交易記錄、抵押信息、醫(yī)療、通訊、電商交易數(shù)據(jù)等,因此大量機構(gòu)和企業(yè)聚焦于私有數(shù)據(jù)的價值挖掘。
與私有數(shù)據(jù)不同,公開數(shù)據(jù)是指每個人都能夠訪問的數(shù)據(jù),種類繁多。人們?nèi)粘I钪须S處可接觸到的行政處罰信息、土地出讓公示、法院公告、新聞、外匯交易信息、股票交易信息、商標(biāo)公示信息、專利公示、域名備案等,都是公開數(shù)據(jù),卻較少人關(guān)注其價值和挖掘潛力?;蛟S正是因為所有人都能訪問,很少有人關(guān)注其背后的價值,也鮮有機構(gòu)具備挖掘其價值的技術(shù)能力。
據(jù)統(tǒng)計,2015年我國大數(shù)據(jù)項目規(guī)模超過100億元,預(yù)計到2020年國內(nèi)企業(yè)級大數(shù)據(jù)市場應(yīng)用規(guī)模將突破200億元,其中私有數(shù)據(jù)占大部分,是大數(shù)據(jù)挖掘領(lǐng)域的紅海;但私有數(shù)據(jù)因其私有性,連接性差、流通壁壘高,和公開數(shù)據(jù)相比,挖掘后的價值增值空間并不明顯。
而讓公開數(shù)據(jù)產(chǎn)品化,對大數(shù)據(jù)企業(yè)的產(chǎn)品理念和技術(shù)能力都提出了更大挑戰(zhàn)。這個鮮有人關(guān)注的領(lǐng)域常面臨“有數(shù)據(jù)的沒技術(shù),有技術(shù)的沒數(shù)據(jù)”的困境,
公開數(shù)據(jù)具有公開、透明、種類繁多等特征,最能夠體現(xiàn)大數(shù)據(jù)“連接”本質(zhì),相反,私有數(shù)據(jù)則因其私有性而具有連接性差、流通壁壘高的特點。私有數(shù)據(jù)已經(jīng)是大數(shù)據(jù)的紅海領(lǐng)域,而公開數(shù)據(jù)則是一塊藍(lán)海。
國家發(fā)改委副主任林念修稱,未來5年,中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模年均增長率將超50%,到2020年數(shù)據(jù)總量將占全球兩成,成為世界第一數(shù)據(jù)資源大國和全球數(shù)據(jù)中心。
國際數(shù)據(jù)挖掘協(xié)會中國分會主席、香港科大計算機系主任楊強教授指出,少量公開數(shù)據(jù)的獲取難度不大,但是真正對于商業(yè)決策有幫助的大量公開數(shù)據(jù)的收集難度是很大的,搜索、整理、挖掘、呈現(xiàn)出其中的關(guān)聯(lián)關(guān)系、并呈現(xiàn)出一個具象化的結(jié)果,這個難度就更大,所以目前需要一個高效、直接的方法把雜亂信息轉(zhuǎn)換為決策支持。