目前有些流行觀點認(rèn)為,在大數(shù)據(jù)時代,技術(shù)容許人們擁有了總體因此抽樣不再重要、另外由于數(shù)據(jù)挖掘術(shù)的進展,只需關(guān)心相關(guān)關(guān)系而不必再關(guān)心因果關(guān)系。而GFT的實例表明,即便谷歌公司用于GFT計算的是數(shù)十億的觀測值,也不能認(rèn)為谷歌公司擁有了流感人群的總體。誤認(rèn)為數(shù)據(jù)體量大就擁有了總體,就無法謙卑結(jié)合其他渠道的小數(shù)據(jù),得到更為穩(wěn)健的分析結(jié)論。而GFT估計的偏誤原因,從來都離不開人們的主動的行為– 無論是谷歌公司自己認(rèn)為的GFT的流行導(dǎo)致更多人使用該搜索、還是Lazer等人認(rèn)為的算法變化、丟棄異常值。因此,不明白數(shù)據(jù)生成機理變化的原因而只看相關(guān)關(guān)系的后果,于谷歌是GFT的計算偏誤丟了臉,而對熱情地投身于采用大數(shù)據(jù)到創(chuàng)新、創(chuàng)業(yè)中的中國民眾和相關(guān)機構(gòu)來說,則可能是不得不面對重大的意外經(jīng)濟損失。