“大數(shù)據(jù)”,其實(shí)并不是新的概念和現(xiàn)象。早在1980 年代,美國就有人提出了“大數(shù)據(jù)”的概念。30多年來,由于信息技術(shù)的進(jìn)步,各個領(lǐng)域的數(shù)據(jù)量都在迅猛增長,美國的企業(yè)界、學(xué)術(shù)界也不斷地對這個現(xiàn)象及其意義進(jìn)行探討。最近這一兩年,“大數(shù)據(jù)”這個概念在美國變得越來越流行、越來越重要。2012年3月,美國聯(lián)邦政府宣布投入2億多美元啟動大數(shù)據(jù)的研發(fā)任務(wù),并把大數(shù)據(jù)定義為和歷史上的互聯(lián)網(wǎng)、超級計(jì)算同等重要的國家戰(zhàn)略。之所以上升到國家戰(zhàn)略的層面,是因?yàn)殡S著數(shù)據(jù)的爆炸,數(shù)據(jù)的收集、保存、維護(hù)、共享、使用等等任務(wù),都成為橫跨各個領(lǐng)域、牽一發(fā)而動全身的現(xiàn)象和挑戰(zhàn)。但這些現(xiàn)象和挑戰(zhàn)的重中之重,還是因?yàn)槿祟惙治龊褪褂脭?shù)據(jù)的能力大幅提高,通過數(shù)據(jù)的分析、開發(fā)和整合,人類現(xiàn)在可以發(fā)現(xiàn)新的知識、創(chuàng)造新的價(jià)值,從而帶來“大知識”、“大科技”、“大智能”、“大利潤”和“大發(fā)展”。
也就是說,大數(shù)據(jù)之“大”,其側(cè)重點(diǎn)并不在于其表象的“大容量”,而在于其潛在的“大價(jià)值”。大數(shù)據(jù)的意義,也遠(yuǎn)遠(yuǎn)不局限于我們當(dāng)前眾多新聞報(bào)道中所津津樂道的“啤酒和尿布”等等通過數(shù)據(jù)挖掘、實(shí)現(xiàn)精準(zhǔn)營銷的故事。我認(rèn)為,大數(shù)據(jù)之所以能被稱為革命性的現(xiàn)象,是因?yàn)樗鼧?biāo)志著我們?nèi)祟惿鐣趶男畔r(shí)代、經(jīng)由知識時(shí)代快速向智能時(shí)代邁進(jìn)。
我們不妨舉一兩個例子,來說明大數(shù)據(jù)對社會形態(tài)的影響,以及對國家戰(zhàn)略的重要性。
今年以來,一股在線教育的浪潮正在席卷美國的教育領(lǐng)域,一系列新型的智能網(wǎng)絡(luò)學(xué)習(xí)平臺正在成為高科技領(lǐng)域創(chuàng)新和投資的重點(diǎn),其中不少新興的創(chuàng)業(yè)公司已經(jīng)獲得了初步的成功。如著名的在線教育公司Coursera,已經(jīng)和普林斯頓、伯克利、賓夕法尼亞大學(xué)等30多所大學(xué)合作,在互聯(lián)網(wǎng)上免費(fèi)開放大學(xué)課程。也就是說,如今這些學(xué)校的一些課程,可以實(shí)現(xiàn)全球幾十萬人同步學(xué)習(xí)。分布在世界各地的學(xué)習(xí)者不僅可以在同一時(shí)間實(shí)時(shí)聽取同一位老師的授課,還和在校生一樣,做同樣的作業(yè)、接受同樣的評分和考試。一些學(xué)校,甚至開始投資建設(shè)自己的智能網(wǎng)絡(luò)學(xué)習(xí)平臺,今年5月,哈佛大學(xué)與麻省理工學(xué)院就宣布,將投入6000萬美元建設(shè)一個智能學(xué)習(xí)平臺,并向全世界免費(fèi)開放。
這種智能網(wǎng)絡(luò)學(xué)習(xí)平臺的崛起,在美國引起了廣泛的關(guān)注和激烈的討論。其中的原因,是因?yàn)檫@個平臺已經(jīng)不是一個鏡頭、一段錄像那么簡單,而是能提供“行為評價(jià)和誘導(dǎo)”的智能平臺。例如,通過記錄鼠標(biāo)的點(diǎn)擊,計(jì)算機(jī)能夠記錄你在一張幻燈片上停留的時(shí)間,判別你在答錯一道題之后有沒有回頭復(fù)習(xí),統(tǒng)計(jì)你在網(wǎng)上提問的次數(shù)、參與討論的多少,發(fā)現(xiàn)不同的人對不同的知識點(diǎn)的不同反應(yīng),從而總結(jié)出哪些知識點(diǎn)需要重復(fù)或強(qiáng)調(diào),哪種陳述方式或?qū)W習(xí)工具最有效等等規(guī)律。再根據(jù)這些規(guī)律和分析,對學(xué)習(xí)者的學(xué)習(xí)行為進(jìn)行自動的提示、誘導(dǎo)和評價(jià),以彌補(bǔ)沒有老師面對面交流指導(dǎo)的不足。
這個智能學(xué)習(xí)平臺之所以強(qiáng)大,正是因?yàn)槠浔澈蟮拇髷?shù)據(jù)。單個個體學(xué)習(xí)行為的數(shù)據(jù)似乎是雜亂無章的,但當(dāng)數(shù)據(jù)累積到一定程度時(shí),群體的行為就會在數(shù)據(jù)上呈現(xiàn)一種秩序和規(guī)律。通過收集數(shù)據(jù),分析、總結(jié)這種秩序和規(guī)律,就能通過計(jì)算機(jī)對學(xué)習(xí)者提供有效的指導(dǎo)和幫助。哈佛和麻省理工學(xué)院之所以向全世界免費(fèi)開放它們的學(xué)習(xí)平臺,目的就是想讓更多的學(xué)習(xí)者在上面學(xué)習(xí),以收集更多的數(shù)據(jù),從而研究世界各國學(xué)習(xí)者的行為模式,進(jìn)而打造出更好的智能學(xué)習(xí)平臺。
這個例子,不僅說明數(shù)據(jù)正在成為創(chuàng)新的基礎(chǔ)、成為一個組織的財(cái)富,同時(shí),也表明大數(shù)據(jù)正在催生一個更加智能的社會。那么,我們又該如何理解正在邁進(jìn)的這個智能型社會呢?
理解這個問題的關(guān)鍵在于,無論是信息、知識,還是智能,在我們這個時(shí)代,都是以數(shù)據(jù)為載體存在的。數(shù)據(jù)是對信息的客觀記錄,當(dāng)我們對數(shù)據(jù)賦予背景時(shí),它就成為信息;信息是知識的來源,當(dāng)把信息提煉出規(guī)律的時(shí)候,它就上升為知識;知識是智能的基礎(chǔ),當(dāng)電腦、網(wǎng)絡(luò)能夠利用某種知識作出自動判別并采取行動為我們?nèi)祟惞ぷ鞯臅r(shí)候,智能就產(chǎn)生了。信息時(shí)代的特點(diǎn)是信息流動的速度快、傳播的廣度大,新信息隨時(shí)隨地可得。如果以1946年人類發(fā)明第一臺電子計(jì)算機(jī)為起點(diǎn),人類社會進(jìn)入信息時(shí)代已經(jīng)有半個多世紀(jì)。應(yīng)該說,這半個多世紀(jì)以來,信息技術(shù)在不斷飛速發(fā)展,我們已經(jīng)超越了信息時(shí)代,進(jìn)入了知識時(shí)代。知識時(shí)代的最大特點(diǎn),是知識無所不在,這也已經(jīng)成為現(xiàn)實(shí)。各種各樣經(jīng)過整理的結(jié)構(gòu)化、系統(tǒng)化的信息,例如以視頻為載體的課程錄像,已經(jīng)在互聯(lián)網(wǎng)上廣泛傳播,只要有心,知識也隨手可得。大數(shù)據(jù)的出現(xiàn),又促使我們向智能時(shí)代邁進(jìn),智能時(shí)代的特點(diǎn)是,無處不在的計(jì)算機(jī)和網(wǎng)絡(luò)將像有智商的人一樣,通過自動化的決策,為人類提供服務(wù)。這個時(shí)代,管理將更加精確、智能,人與人之間的合作、任務(wù)之間的對接會更加精準(zhǔn),國家和社會的運(yùn)行成本將會越來越低。