我們怎么認識到這個世界在發(fā)生什么。我覺得用簡單的變革無法形容,可能應(yīng)該用地理大發(fā)現(xiàn),工業(yè)革命這樣的科學(xué)發(fā)現(xiàn),用新邊疆這樣的詞才能理解計算機從60年代進入企業(yè),70年代進入個人,互聯(lián)網(wǎng)時代計算機到了我們的社會計算,到今天計算機一個最主要的成果,最輝煌的時候已經(jīng)到來,就是云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)。它在各個方面改變我們工業(yè)革命兩三百年來固定的我們的價值觀、生活方式、業(yè)務(wù)模式。我覺得下一步的政府、各種力量都在發(fā)生變化。我認為網(wǎng)絡(luò)不是簡單的一個技術(shù),它是一個力量,它在塑造社會,塑造未來的競爭,塑造人的價值觀。
到底大數(shù)據(jù)和過去有什么不一樣?數(shù)據(jù)早就開始了,我們知道知識產(chǎn)生數(shù)據(jù),數(shù)據(jù)早就有了,為什么今天叫大數(shù)據(jù),為什么今天的數(shù)據(jù)能解決我們過去我們解決不了的問題?我們知道過去最早的數(shù)據(jù)產(chǎn)生還是從早期的結(jié)繩記事,到文字。但是在計算機數(shù)據(jù),0、1出現(xiàn)之后,計算機大規(guī)模的應(yīng)用是在軍事部隊,真正用的時候在IBM的組建,它當(dāng)時解決的問題是整個計算機主機時代解決的問題,是結(jié)構(gòu)型的數(shù)據(jù)。就是你在什么時間干了什么事,最早應(yīng)用在銀行,人體普查等。多大年齡,在什么地方,誰花了多少錢,存了多少錢,誰打了電話,花了多長時間,這個數(shù)據(jù)在過去30年,40年,從IBM組建開始之后,數(shù)據(jù)處理的都是結(jié)構(gòu)型數(shù)據(jù),它相比大數(shù)據(jù)是小數(shù)據(jù),用這個詞容易理解。
什么時候數(shù)據(jù)發(fā)生了根本的變化?數(shù)據(jù)從結(jié)構(gòu)型數(shù)據(jù)出現(xiàn)了另外一個數(shù)據(jù),如果第一個數(shù)據(jù)叫結(jié)構(gòu)型數(shù)據(jù),第二類數(shù)據(jù),交流型的數(shù)據(jù)出現(xiàn)了。在網(wǎng)上論壇發(fā)表的評論、照片跟別人分享,今天我們隨時都在做這樣的事,這些數(shù)據(jù)特點跟結(jié)構(gòu)型數(shù)據(jù)完全不一樣。這樣就出現(xiàn)一個場景是數(shù)據(jù)量的突然增加,圖片、文字各種各樣的狀態(tài),都是隨著人與人之間的交流出現(xiàn)的。過去數(shù)據(jù)庫是為了結(jié)構(gòu)型的數(shù)據(jù),關(guān)系型數(shù)據(jù)庫而建的。我們過去的存儲計算都沒有為非結(jié)構(gòu)化數(shù)據(jù)做準備。它的到來實際上是互聯(lián)網(wǎng)開始,互聯(lián)網(wǎng)電子商務(wù),互聯(lián)網(wǎng)社交網(wǎng)絡(luò)的組建出現(xiàn)了所謂的非結(jié)構(gòu)的,或者叫交易型數(shù)據(jù)。這些數(shù)據(jù)的出現(xiàn),量比過去的量大了不知道多少倍。有人講今天一天用智能手機拍的照片,每天都超過人類歷史上照片的總和,不知道是不是準確,但是這個量可以想像。交流型數(shù)據(jù)的出現(xiàn)實際上是第二類數(shù)據(jù)出現(xiàn)。第三類數(shù)據(jù)量,就是互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù),我們的攝像探頭、手環(huán),未來的桌子、電冰箱都會產(chǎn)生數(shù)據(jù),因為都要智能化了。未來大數(shù)據(jù)構(gòu)成實際上是三種類型構(gòu)成,一個結(jié)構(gòu)型數(shù)據(jù),一個交易型、交流型數(shù)據(jù)和觀測型數(shù)據(jù),這三種數(shù)據(jù)構(gòu)成了今天的數(shù)據(jù)存在。第一種數(shù)據(jù)存在了60、70年,第二種數(shù)據(jù)交流型數(shù)據(jù)是這一二十年開始的,觀測型數(shù)據(jù)是剛剛開始。人類到了一個大數(shù)據(jù)的時代,為什么用“海量”這個詞比較好,因為到了數(shù)據(jù)海量的時候,如果過去發(fā)現(xiàn)了新的大陸是征服了物理的海洋,今天真的到了無所不在的數(shù)據(jù)的時代。
對大數(shù)據(jù)時代的理解,觀念上大家認識不是特別的清晰。商業(yè)對我們的沖擊,就是“行”的問題已經(jīng)到了我們生活中,但對整個的社會的變革剛看到端倪,就像剛剛看到新大陸的時候,除了看到一大堆各種各樣的物種,沒有想到橡膠跟工業(yè)革命有關(guān),煙草能改變整個人類社會行為,發(fā)現(xiàn)了新的食品能使人類的生活質(zhì)量有大的提高,我覺得我們還處于一個非常早期的大數(shù)據(jù)時代,就是我覺得還是1.0的時候,我們還在觀念認識階段,在沖擊和困惑的階段。另外一方面,對于這樣一個時代的變革,實際上我們很多的東西沒有做好準備,在這樣的時代,什么樣的計算機網(wǎng)絡(luò),什么樣的芯片、什么樣的服務(wù)器,什么樣的存儲,什么樣的通訊網(wǎng)絡(luò)才能支持這么大的數(shù)據(jù)。原來電話數(shù)據(jù)存三個月就扔一邊,因為存不了那么多,現(xiàn)在數(shù)據(jù)是資產(chǎn),不能扔,但是存到什么地方去,以最低的成本存下來。大數(shù)據(jù)時代企業(yè)的競爭往哪個方向走,這還是才剛剛開始。
再舉個例子,現(xiàn)在很重要的詞,因為在商言商,講企業(yè),現(xiàn)在企業(yè)開始有了一個詞叫數(shù)據(jù)驅(qū)動的企業(yè)。舉個例子科技日報,比如在過去有10萬用戶,但是不知道用戶看沒有看,已有的信息就是某某訂了科技日報,但是不知道每天拿到報紙是否認真閱讀了,也不知道看了哪篇文章,也不知道第二年是否會續(xù)訂,會訂多少份等。那時候是盲人摸象,粗數(shù)據(jù)的時代?,F(xiàn)在是以數(shù)據(jù)來驅(qū)動的。比如人有IQ,有智慧,大部分的企業(yè)沒有IQ,未來應(yīng)該有IQ,就是積累大量的數(shù)據(jù),誰在什么地方看了多少報紙,在什么時候用了什么樣的設(shè)備,這個時候就可以定制要什么,可預(yù)測,然后進行經(jīng)營。