每天都有成千上萬的人通過Google來搜索信息,從旅途需要花費(fèi)多長時間到怎樣治療他們孩子的病,各式各樣的信息都有,這無疑極大的方便了人們的生活。
這一系列的搜索數(shù)據(jù)也從側(cè)面顯示出了搜索這些信息的人本身的情況,比如他們的想法、需求、憂慮等非常有價值的信息。如果這些信息的搜索可以準(zhǔn)確的反映出人們的生存情況,那么分析人員就有可能利用這些信息追蹤疾病情況,預(yù)測新商品的銷售情況,甚至預(yù)測選舉的結(jié)果。
2008年,谷歌的研究人員探索了其中的可能性,并宣稱他們能夠根據(jù)人們在搜索引擎上留下的信息對流感進(jìn)行“即時預(yù)報”。研究人員在《自然》雜志上撰文表示,能夠進(jìn)行這種預(yù)測的關(guān)鍵在于一旦人們患上了流感,就會在谷歌中搜索很多關(guān)于流感的相關(guān)信息,這就可以形成有關(guān)于流感流行情況的整體性趨勢信號。該文章還表示,如果把谷歌搜索引擎上的相關(guān)信息與美國疾病預(yù)防控制中心(Centers for Disease Control and Prevention,CDC)的流感監(jiān)測信息進(jìn)行調(diào)整對比,就可以提供更為精準(zhǔn)的流感趨勢預(yù)測,這不僅把人們在搜索引擎上留下的“垃圾”變成了拯救生命的“啟示”,并比當(dāng)前CDC的數(shù)據(jù)預(yù)測預(yù)測提早至少2周。
這一切聽起來都很有道理,然而理想很豐滿,現(xiàn)實(shí)很骨感。谷歌流感趨勢(Google Flu Trends,GFT)最終還是失敗了,而且失敗得徹徹底底:相比于2013年實(shí)際的流感趨勢,GFT的預(yù)測偏差高達(dá)140%。當(dāng)谷歌黯然關(guān)閉GFT的時候,這個項(xiàng)目已經(jīng)從“大數(shù)據(jù)運(yùn)用的典范”變成了“大數(shù)據(jù)的缺陷的典范”。