團購、社交媒體、電商;云,O2O,大數(shù)據(jù)。每個階段都有熱點詞。這會兒最熱的應該就是“大數(shù)據(jù)”了。不過,有點濫,有點俗,似乎也有點泡沫化了。不用擔心,一般來講,講得最厲害的時候,時候還早呢;等到無聲無息了,那真是隨風潛入夜了。但是,說真的,處于這個風云激蕩創(chuàng)業(yè)年代的人們,如果能夠靜下心仔細了解點有關(guān)大數(shù)據(jù)的概念、框架、實質(zhì),對于形成所謂的“大數(shù)據(jù)觀”,真心有必要,真心有幫助。
市面上如今關(guān)于大數(shù)據(jù)的書,近20種。挑出這三本,是有理由的。不僅單本比較靠譜,講述得有意思,而且串聯(lián)起來,竟然有邏輯聯(lián)系,有互補,好像商量好了似的首先看巴拉巴西的《爆發(fā)》,在一個歷史故事的連續(xù)講述中,了解大數(shù)據(jù)的概念實質(zhì);接著看舍恩伯格的《大數(shù)據(jù)時代》,明白大數(shù)據(jù)理念和生活工作及思維變革的關(guān)系;最后翻翻涂子沛的《大數(shù)據(jù)》,看美國政府在大數(shù)據(jù)開放上的進程與反復,算是個案。如果能夠基本了解這三本的觀點,出門有底氣,見人腰桿直,不再被忽悠。
“人生看似雜亂無章,其實有規(guī)可尋”,巴拉巴西整本書講述的大數(shù)據(jù)根本目的,是預測。他甚至有零有整地判斷,人類行為93%是可以預測的。打個比方,千百年前人類無法如今天般準確預測天氣,以致某些大致預測的行為都被認為是“通神”,其實核心在于對天氣數(shù)據(jù)的海量占有和分析能力。但假如全人類的所有基礎及行為數(shù)據(jù)全部被占有全部能分析呢?比如通過智能終端LBS功能采集全部運動軌跡、通過金融系統(tǒng)采集所有支付記錄、通過SNS采集所有社會關(guān)系和通過郵件、文檔、社會視頻監(jiān)控和自我視頻監(jiān)測采集所有言行記錄,24小時,每分每秒,一生,全地球70億人,那會如何?
人往極大和極小處思考哪怕想像的話,一方面頭會疼會暈,一方面會因為這種宏大性或窮盡性而恐懼??苹妹钥吹缴厦娴拿枋?,不知會否想起科幻小說巨匠阿西莫夫的《基地》系列,起源就是主角對銀河帝國社會未來數(shù)千年的發(fā)展和危機的宏大預測,導致一系列綿延千百年的基地、第二基地拯救計劃。也就是說,阿西莫夫大約在50年前就在思考“大數(shù)據(jù)”問題了。
巴拉巴西不是個通俗科幻小說家。他是全球復雜性網(wǎng)絡科學領域最前沿的領軍科學家,他要傳遞的不是科幻故事,而是一整套新的理解人類行為時空模式的觀念和理論。作者的核心觀點,是認為當我們將生活數(shù)字化、公式化和模式化的時候,會發(fā)現(xiàn)大家都很相似,都具備爆發(fā)模式,而且非常規(guī)律,看上去隨意偶然,其實極易預測前提自然是占有和分析海量大數(shù)據(jù)而在計算機運算能力、網(wǎng)絡發(fā)展階段和社交邏輯被成熟之前,這些做不到而已。
科學的盡頭和哲學、宗教是交融的。因此,巴拉巴西的理論不止是互聯(lián)網(wǎng)復雜科學的一項探索,本質(zhì)是一種新歷史觀的論證,甚至是一種哲學。這么深艱的命題,作者講述得非常漂亮,十幾章節(jié)講述了十字軍的一段歷史故事,泰勒格迪預測主人公塞克勒起義并一路發(fā)展至兵敗坐上“燃燒的御座”,帶上燒紅的鐵王冠;講述了藝術(shù)家哈桑的旅行,因為被安檢不斷懷疑是恐怖分子,而自愿“自我量化”,記錄自己所有行蹤并不斷公布在個人網(wǎng)站,實現(xiàn)個人數(shù)據(jù)全積累全公開;一張一美元鈔票被跟蹤被記錄所有的軌跡??梢哉f,這本書整個就在講故事,這是我最佩服老外科學作者的地方,如此艱澀的話題,我們可以寫成只有幾個人懂的論文,他可以寫成一氣呵成的故事集!
轉(zhuǎn)到《大數(shù)據(jù)時代》這本書。它被包括寬帶資本董事長田朔寧、知名IT評論人謝文等專業(yè)讀者鑒定為“大數(shù)據(jù)領域最好的著作沒有之一,一本頂一萬本”。有這么好嗎?看完自己評價吧。這本書對這個大規(guī)模產(chǎn)生、分享和應用數(shù)據(jù)的新的大時代進行了闡述和厘清,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關(guān)不要因果”三大理念,通過數(shù)十個商業(yè)和學術(shù)案例,剖析了萬事萬物數(shù)據(jù)化和數(shù)據(jù)復用挖掘的巨大價值。
如作者所言“大數(shù)據(jù)開啟了一次重大時代轉(zhuǎn)型。就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們看清微生物一樣,大數(shù)據(jù)要改變的是,我們的生活方方面面以及理解世界的方式”。比如,谷歌通過全球搜索分析,比國際疾病控防中心更早更準地預測了流感爆發(fā)。
在思維變革部分,作者講述的重點是:樣本=總體,我們需要對全部數(shù)據(jù)的占有和分析;因此,數(shù)據(jù)缺乏時代的精確性不必執(zhí)迷,接受混雜基于大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效;樣本推斷的因果關(guān)系不重要了,知道“是什么”的相關(guān)關(guān)系,或者結(jié)果就可以了。如果說上一本《爆發(fā)》是通過講故事闡述一個核心觀點的話,這一本倒是不遺余力、不計巨細就大數(shù)據(jù)的方方面面進行系統(tǒng)分析和介紹,而且案例非常精彩非常時新。所以,個人覺得,就實務而言,這本的裨益確實比較大。
涂子沛那本冠以《大數(shù)據(jù)》名字的書,我是在三星NOTE上完整看完的第一本手機電子書(花了30元,我是愿意為好數(shù)字內(nèi)容花錢的?。?。全書講述的,是大數(shù)據(jù)在美國政府管理中的應用,以及美國政府運行方式大數(shù)據(jù)變革的歷史與斗爭,其實也是故事性的。從奧巴馬上臺就頒布《信息公開法案》,到設立第一個美國政府首席信息官開始,講述美國政府與民間在社會數(shù)據(jù)公開的斗爭史,以及美國社會管理向大數(shù)據(jù)思維轉(zhuǎn)變的過程。首先,這算是一個最詳實的案例;其次,這代表的不是某種管理方式變革,深處是對民主運行機制的變革與進步。說好了,這本書用心良苦,遠遠超越科普技術(shù)領域;說壞了,其心可誅。有一段,民間斗爭,逼迫奧巴馬公布所有每日白宮全部日程,包括接見了誰、談話的全部內(nèi)容,這不就是個人大數(shù)據(jù)全公開在公眾人物上的應用嗎?這可比現(xiàn)在所謂官員公開財產(chǎn)的要求高了幾十倍這要求政府全部行為、全部數(shù)據(jù)、全部公開,全體公眾隨時可查技術(shù)和成本上其實已經(jīng)可以做到或至少努力接近如果不這么做,不止是落后問題而是真正的其心可誅了。
三本書,延續(xù)觀點實務案例分析的路徑,全景展示了大數(shù)據(jù)這個東西。但重要的是,大數(shù)據(jù)是個概念,是個趨勢,更是一種“觀”,看世界、看未來的一種方法。我們可以拒絕那些言必稱大數(shù)據(jù)的人的浮躁,但絕對不能拒絕世界潮流的確定走向。而就企業(yè)而言,包括全球的谷歌、蘋果、FACEBOOK等互聯(lián)網(wǎng)巨頭,沃爾瑪、塔吉特、亞馬遜等零售巨頭,中國的BAT三巨頭,早就實質(zhì)上已經(jīng)是大數(shù)據(jù)玩家,并且狂奔在大數(shù)據(jù)潮流上很久,而其他叫喚“大數(shù)據(jù)”的其實連基本資格都沒有叫的狗不咬人??梢哉f,除了巨頭,所有其他家伙都跟大數(shù)據(jù)沾不上實質(zhì)的邊,只有打打下手的機會;但實際上,每個企業(yè),甚至個人,都已經(jīng)是大數(shù)據(jù)的一部分、一環(huán)節(jié)了。
數(shù)千字難言書中真諦。馬上開始你的拯救大數(shù)據(jù)白癡之旅吧。
原文鏈接http://www.huxiu.com/article/8740/1.html