小數(shù)據(jù)
對于源自大數(shù)據(jù)集偏見的問題,另一個潛在的應(yīng)對方法是部分人所說的“小數(shù)據(jù)”。小數(shù)據(jù)是指,數(shù)據(jù)集足夠簡單到可以直接由人來分析和解讀,不需要求助于超級計算機或者Hadoop作業(yè)。跟“慢餐”一樣,該詞也是因為其相反面的流行而產(chǎn)生。
丹麥作家、營銷顧問馬丁·林德斯特羅姆(Martin Lindstrom)在他2016年的著作《小數(shù)據(jù):揭示大趨勢的微小線索》中談到了那種做法。例如,丹麥知名玩具廠商樂高(Lego)依據(jù)大量聲稱千禧一代需要即時滿足,更容易被比較輕松的項目吸引的研究,轉(zhuǎn)向提供更大的積木,還在1990年代末和2000年代初打造主題公園和視頻游戲。這種轉(zhuǎn)型沒有奏效。
那種由數(shù)據(jù)驅(qū)動的范式最后被它的營銷者2004年進(jìn)行的一項范圍小得多的人類學(xué)調(diào)查顛覆。它的營銷者逐個詢問小孩他們最珍愛什么物品,發(fā)現(xiàn)他們最喜歡也最忠于可讓顯示出其苦苦練就的能力的產(chǎn)品——比如一雙因數(shù)百個小時的滑板練習(xí)而磨損的舊運動鞋。據(jù)林德斯特羅姆(他曾擔(dān)當(dāng)樂高的顧問,自己也很喜歡玩樂高積木)說,樂高重新專注于提供它原來的小積木,由此實現(xiàn)復(fù)興。
在很多方面,亞馬遜是可充分說明大數(shù)據(jù)威力的典型例子。它關(guān)于其數(shù)以億計的顧客的購買和商品瀏覽習(xí)慣的數(shù)據(jù),幫助它成為全世界最成功的零售商之一。不過,布拉德·斯通(Brad Stone)在他的書《萬貨商店》(Everything Store)中稱,該公司的CEO杰夫·貝索斯(Jeff Bezos)有個很有趣(對于他的員工來說則很可怕)的方式來平衡所有的那些客觀數(shù)據(jù)分析。他時不時會將顧客發(fā)來的投訴郵件轉(zhuǎn)發(fā)給他的高層團隊,要求他們不僅僅要解決投訴的問題,還要徹底調(diào)查清楚它發(fā)生的原因,并撰寫一份解釋報告。
這說明,貝索斯不僅僅理解大數(shù)據(jù)提升各個系統(tǒng)運行效率的威力,還知道大數(shù)據(jù)也要可能會掩蓋沒有得到有效估量的特定問題的發(fā)生原因和機制。在根據(jù)你知道該如何測量的事情做出決策的時候,安全的做法是確保也有機制讓你能夠知道你不知道該如何估量的事情。“問題總是,你沒有收集什么數(shù)據(jù)?”奧尼爾在接受電話采訪時表示,“什么數(shù)據(jù)是你看不到的?”
未來展望
隨著“大數(shù)據(jù)”不再被當(dāng)做熱詞,我們有希望逐漸對數(shù)據(jù)的威力和陷阱形成更加細(xì)致入微的理解?;仡^來看,收集數(shù)據(jù)的傳感器和分析數(shù)據(jù)的超級計算機一下子大量涌現(xiàn),引發(fā)一股淘金熱,以及很多時候錯失這一切的恐懼會壓過你的審慎情緒,都是可以理解的。與此同時,必然會有深思熟慮的人開始引起我們對這些情況的注意,大數(shù)據(jù)也不可避免地會帶來反效果。
不過,大數(shù)據(jù)誤用帶來的威脅,不會僅僅因為我們不再用敬畏的口吻來說那個詞而消失。看看Gartner 2017年技術(shù)成熟度曲線的頂峰,你會看到像機器學(xué)習(xí)和深度學(xué)習(xí)這樣的詞,以及代表這些計算技術(shù)的現(xiàn)實應(yīng)用的無人駕駛汽車、虛擬助手等相關(guān)的詞。這些是基于與大數(shù)據(jù)一樣的基礎(chǔ)的新“棚架層”,它們?nèi)家蕾囉诖髷?shù)據(jù)。它們已經(jīng)走在通向真正的突破的道路上——但可以肯定的是,它們也會導(dǎo)致嚴(yán)重的錯誤。