時間是1948年,地點是中國東北。遼沈戰(zhàn)役進入關(guān)鍵階段。對于第四野戰(zhàn)軍司令員林彪來說,拿下錦州后的最重要目標就是打敗前來增援的國民黨新六軍。林彪使用的方法就是每天聽取“軍情匯報”,由值班參謀員讀出下屬各個部隊的當日戰(zhàn)況和繳獲情況。
那幾乎是千篇一律的數(shù)據(jù),異??菰?。直到有一天,林彪突然發(fā)現(xiàn),在胡家窩棚的一場兩軍遭遇戰(zhàn)中,繳獲短槍與長槍的比例比其他戰(zhàn)斗略高,擊毀小車與大車的比例比其他戰(zhàn)斗略高,俘虜和擊斃的軍官與士兵的比例比其他戰(zhàn)斗略高。
林彪由此斷定,國民黨軍隊的指揮所就在這附近,他下令立即對從這里逃走的敗軍進行追擊。果然,部隊很快就在附近抓住了國民黨方面的指揮官廖耀湘,此成果揭開了中共軍隊遼沈戰(zhàn)役勝利的序幕。
林彪當年的做法符合近年風行全球并深入改變世界的大數(shù)據(jù)的簡單定義——從在別人看來枯燥乏味的數(shù)據(jù)中,發(fā)現(xiàn)有價值的信息,并將其轉(zhuǎn)化為機會。
人類社會全面數(shù)字化引發(fā)了數(shù)據(jù)量爆炸式增長。人、資金、商品的流動都以數(shù)據(jù)化方式呈現(xiàn)。當前,每天在全球各行各業(yè)產(chǎn)生的數(shù)據(jù)已經(jīng)足以填滿超過2億張DVD光盤——在這些看似雜亂無章的數(shù)據(jù)中,蘊藏著無限的金礦。
近年,伴隨著存儲能力、計算能力和傳輸能力的進步,人們開采這些金礦成為可能。數(shù)據(jù)不僅成為推動行業(yè)融合兼并、企業(yè)做大做強的戰(zhàn)略性資產(chǎn),更是體現(xiàn)一個國家綜合國力的重要組成部分,成為陸、海、空權(quán)益之外的另一種國家核心資產(chǎn)。
當前,大數(shù)據(jù)時代無可爭議地來臨了。它源自全球數(shù)十年的技術(shù)積累,但僅用了最近兩三年時間,便迅速滲透到各個行業(yè)。中國并不例外,百度、阿里巴巴、新浪微博、騰訊微信等最核心的資產(chǎn)便是大數(shù)據(jù);眾多行業(yè)、企業(yè)開始使用并利用大數(shù)據(jù)作出變革;中國6億多網(wǎng)民的上網(wǎng)記錄等正成為大數(shù)據(jù)的核心內(nèi)容。
在財新記者采訪的諸多業(yè)內(nèi)人士看來,大數(shù)據(jù)來臨的勢頭甚至比十幾年前互聯(lián)網(wǎng)泡沫時期還要迅猛。大數(shù)據(jù)更加實際、更容易落地、盈利模式更清晰。由大數(shù)據(jù)推動的行業(yè)變革,將會對整個世界格局產(chǎn)生顛覆性的影響。
而對于普通公眾來說,雖處于大數(shù)據(jù)時代,但對大數(shù)據(jù)仍是陌生的。大數(shù)據(jù)在中國正在做些什么?一家企業(yè)或一個個人可以得到何種便利,又或可能遇到何種“壞處”?了解大數(shù)據(jù),是解惑的開始。
“國家核心資產(chǎn)”
2012 年3月22日,奧巴馬政府宣布投資2億美元拉動大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國家戰(zhàn)略。奧巴馬政府將大數(shù)據(jù)定義為“未來的新石油”,并表示一個國家擁有數(shù)據(jù)的規(guī)模、活性及解釋運用的能力將成為綜合國力的重要組成部分,對數(shù)據(jù)的占有和控制將成為陸權(quán)、海權(quán)、空權(quán)之外的另一種國家核心資產(chǎn)。
美國的這一舉動,是繼1993年克林頓政府的“信息高速公路”計劃后的又一次“狂飆突進”。在以中國為代表的新興國家日益對美國的經(jīng)濟、政治影響力構(gòu)成挑戰(zhàn)的時候,通過大數(shù)據(jù)研究提高美國對數(shù)據(jù)資產(chǎn)的掌控能力,有助于美國搶占新的國際戰(zhàn)略制高點。
但是什么是大數(shù)據(jù),迄今為止,在產(chǎn)業(yè)界、學術(shù)界并沒有形成一個公認的科學定義。上海軟件產(chǎn)業(yè)促進中心主任唐全榮接受財新記者采訪時說,他曾經(jīng)和倫敦帝國理工大學一位華裔教授討論,什么是大數(shù)據(jù)?而這位教授認為,能夠處理的數(shù)據(jù)都不能稱為大數(shù)據(jù)。
首先提出大數(shù)據(jù)概念的國際咨詢公司麥肯錫,認為大數(shù)據(jù)就是大小超出常規(guī)數(shù)據(jù)庫工具處理能力的數(shù)據(jù)。國際數(shù)據(jù)公司IDC則用“大體量(volume)”“多樣性(variety)”“快速處理(velocity)”和“高價值(value)”來定義大數(shù)據(jù)。
正是由于大數(shù)據(jù)的這些特性,使得傳統(tǒng)的數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)處理手段都不再適用。社會需要為動態(tài)、高維、復雜的大數(shù)據(jù)建立形式化、結(jié)構(gòu)化的描述方法,進而在此基礎上發(fā)展大數(shù)據(jù)處理技術(shù)。
唐全榮說,跟云計算開始的時候一樣,許多人在爭論定義,而在IT基礎設施從帶寬到存儲能力的發(fā)展讓云計算真正走向應用的時候,就沒有人再關(guān)心它的定義了。而大數(shù)據(jù)概念也是一樣,它也是伴隨著數(shù)據(jù)的處理、存儲和分享能力的提升而出現(xiàn)的,從這個角度上看,大數(shù)據(jù)不僅是指需要處理的數(shù)據(jù)對象,也包括了處理的技術(shù)。