比如,谷歌的算法很容易受到與流感無關(guān)的周期性的詞匯所影響,比如“高中籃球”等。每天都有上百萬的與CDC的數(shù)據(jù)相關(guān)的搜索詞匯,其中的許多搜索都會與流感趨勢緊密相關(guān),但其中也會存在著很多與流感相關(guān)的搜索實(shí)際上并不是又真正的流感病例引起或者與流感趨勢有關(guān)。谷歌也沒有把搜索時(shí)間產(chǎn)生的搜索行為的不同考慮在內(nèi)。在引入GFT后,谷歌還引進(jìn)了參照性的搜索特征以及大量與醫(yī)療健康相關(guān)的附件來幫助用戶更快的找到他們所需要的信息。雖然這對用戶來說非常有用,讓他們可以更好的利用搜索引擎,也使得一些搜索詞匯更為普遍,更利于GFT系統(tǒng)的追蹤。
把大數(shù)據(jù)的功能運(yùn)用于公共利益顯然與谷歌本身是有很大不同的,畢竟谷歌需要更多的信任感,因?yàn)樗枰?jīng)常對用戶的數(shù)據(jù)進(jìn)行“窺探”。用戶的數(shù)據(jù)之所以存在是由于個(gè)人用戶和公司之間雙重的影響,而相關(guān)的法律術(shù)語則經(jīng)常是十分模糊的(又有多少人會仔細(xì)的閱讀相關(guān)的專業(yè)術(shù)語和法律條件呢?)。而交易真正能夠達(dá)成的原因是用戶獲得了服務(wù),而企業(yè)則獲得了相關(guān)的數(shù)據(jù)。
而公共利益則是接下來才會被考慮的。而企業(yè)和消費(fèi)者實(shí)際上都是廣義的社會的一部分,而對這些大數(shù)據(jù)進(jìn)行解讀顯然能夠讓我們大家都獲得好處。正如谷歌CEO埃里克•施密特(Eric Schmidt)所說:“我們必須牢記的是科技一直都只是人類的一項(xiàng)工具。”而關(guān)鍵在于,我們,以及這些科技巨頭們?nèi)绾卫么髷?shù)據(jù)來造福人類的。
谷歌在流感預(yù)測方面的嘗試可能能夠成為企業(yè)利用大數(shù)據(jù)造福社會的一個(gè)好的模式。谷歌已經(jīng)把與流感相關(guān)的搜索數(shù)據(jù)開放給了CDC遺跡一些研究機(jī)構(gòu)。關(guān)鍵的問題在于谷歌接下來是否會與這些研究機(jī)構(gòu)一起來改進(jìn)GFT。未來的版本也許可以更新數(shù)據(jù)追蹤的方式以實(shí)現(xiàn)更精準(zhǔn)的流感趨勢預(yù)測,而數(shù)據(jù)流本身的價(jià)值則將會逐漸減退。