當(dāng)然,這三個因素其實都有不穩(wěn)定性,例如凱文-史派西也曾拍過只被評了4.2分的《弗雷德圣誕老人》,大衛(wèi)-芬奇首次執(zhí)導(dǎo)的《異形3》也成系列中口碑最差的一部。但是從概率上來說,這三個成功因素都包括的劇集更靠譜。
另外國政通推出的“同名同姓”應(yīng)用,雖然看起來比較偏娛樂化實用性不強,但是這背后的那些身份數(shù)據(jù)是可以進行各種二次利用。每次看到類似應(yīng)用,我總會把前同事“操瑞士”的奇葩名字輸進去,現(xiàn)在只有這款應(yīng)用準確的找到了全國只有1個操瑞士,并且是安徽人。呼叫瑞士大使館迅速鎖定他的位置吧!
所以大數(shù)據(jù)的核心并不是擁有數(shù)據(jù),而是拿數(shù)據(jù)去做了什么。也就是說你不能僅僅占有人家的身子,也要占據(jù)人家的心靈。
2.對數(shù)據(jù)的容錯性更強,來源更加多樣化
一個500M的用戶數(shù)據(jù)excel表算不算大數(shù)據(jù)?曾經(jīng)在做某款產(chǎn)品的用戶篩選時,這么一個excel成功拖死我電腦三次,我當(dāng)時憤怒的說:“KAO,這SB大數(shù)據(jù)!”現(xiàn)在想起來,我冤枉了大數(shù)據(jù)君,您受苦了。
真正的大數(shù)據(jù),應(yīng)該是從不同維度,不同途徑過來的各種格式數(shù)據(jù)碎片,并不限于文字/視頻/聲音/位置/圖片等。只有將不同維度的數(shù)據(jù)放在一起判斷,得出來的趨勢才有可能更真實。雷同的數(shù)據(jù)積累的再多,超過某一個限度之后,我們再從新樣本上獲得的有用信息就越來越少,就如同經(jīng)濟學(xué)上的邊際效應(yīng)遞減一樣。而用簡單點兒的話解釋就是如果你已經(jīng)交往過五個IT碼農(nóng),那么第六個其實也不會新鮮到哪里去,倒不如重新調(diào)整方向,換個高富帥找點兒不同的刺激。
多樣化的來源同樣可以避免陷在一個死胡同里出不來。例如以前經(jīng)常說的“三年自然災(zāi)害”,如果僅僅去查詢這三年的天氣狀況和死亡人數(shù)的關(guān)系。那么可能最后得出結(jié)論是“晴朗天氣比陰天更容易致人死亡”。但實際上如果去結(jié)合《人民日報》畝產(chǎn)十萬斤的相關(guān)翔實公正報道再加上那些年中國糧食對外進出口情況,那么就會得出更有建設(shè)性的結(jié)論。在一90后妹子的追問下,只說了四個數(shù)字。1958年,中國出口糧食288.34萬噸,進口22.35萬噸。困難時期第一年,1959年,中國出口415.75萬噸,進口0.20萬噸,那年,聽說大家都好餓。別不多說,免得喝茶。
再舉個例子,這兩天淘寶首頁給我推送的個性化廣告除了情趣用品就是“花花公子”服飾大優(yōu)惠,我不就是為了找素材和配圖搜了一下“情趣用品”么?你們沒完沒了的給我推送這個,節(jié)操何在?如果你們能拿到我小學(xué)老師的評語,初中老師的評語和操行評定,高中老師的評語和操行評定,通過對多個來源不同的數(shù)據(jù)源分析,那么你們給我推送的一定會是《鋼鐵是怎么煉成的》《雷鋒日記》等好書。(大學(xué)老師的評語就算了,那廝打CS被我蹂躪了太久容易懷恨在心。)
3.擁有大數(shù)據(jù)的身,也要有大數(shù)據(jù)的心
以往的數(shù)據(jù)分析,更多的是精確的樣本/深度的數(shù)據(jù)挖掘,“精確”就是其代名詞。不符合規(guī)格的樣本過濾掉,然后再深度挖掘數(shù)據(jù)字段間的關(guān)系,得出幾個精確無比數(shù)字去做PPT,或者從一系列數(shù)據(jù)里精準的找到某個正一臉猥瑣偷拍姑娘的人。
但是大數(shù)據(jù)更多的是通過對各種數(shù)據(jù)分析得出某種趨勢,這種趨勢不必過于精確,但是能讓相關(guān)決策人有底氣去做某項決定。大數(shù)據(jù)不重要,重要的是使用大數(shù)據(jù)的人。
因為哪怕面向完全相同的數(shù)據(jù)源,不同的人得出的結(jié)論或者決定也可能是截然不同的。三國赤壁大戰(zhàn),當(dāng)龐統(tǒng)獻計“若以大船小船各皆配搭,或三十為一排,或五十為一排,首尾用鐵環(huán)連鎖,上鋪闊板,休言人可渡,馬亦可走矣”時,同時聽到這話的兩個人,曹操下席而謝,“非先生良謀,安能破東吳耶!”,而徐庶卻私下里扯住龐統(tǒng)“你好大膽,只恐燒不盡絕?!庇纱丝梢?,“以人為本”是多么精辟的一句廢話啊!
無論你NB還是SB,數(shù)據(jù)總在那里,不離不棄。
4.強調(diào)趨勢和未來
大數(shù)據(jù),更多的應(yīng)該是分析過去,提醒現(xiàn)在,展望未來。無法用到實踐中去的大數(shù)據(jù)都是耍流氓,無論這個結(jié)果是造福了全人類,還是幫助網(wǎng)站提高1%轉(zhuǎn)化率,這都是有用的。
上圖這充滿著暴力氣息的玩意是當(dāng)年冷戰(zhàn)期間美國和蘇聯(lián)研發(fā)的高速列車,他們將轟炸機上的渦輪直接裝在了火車頂上。其中美國的M-497號在1966年俄亥俄州的鐵軌上跑出了295.54公里/小時。雖然幾十年后,才有了現(xiàn)代高速鐵路,但是如果沒有最初的這種野蠻實驗,恐怕現(xiàn)在自主研發(fā)的高鐵也沒有那么充足的底氣。
更多詳細信息,請您微信關(guān)注“計算網(wǎng)”公眾號: