冬天來臨,世界許多地方都出現(xiàn)了流感癥狀。據(jù)美國疾病控制管理中心稱,美國29個周及紐約都發(fā)出了流感高爆發(fā)預(yù)警,其他的9個州也出現(xiàn)了輕微流感病例。
在世界范圍內(nèi)監(jiān)控流感病情的最好方法一直沒有定論,但谷歌聲稱其創(chuàng)新性方案利用聚合搜索數(shù)據(jù)對流感進行跟蹤,可達到接近實時的效率。Google Flu Trends網(wǎng)站并不是第一次出現(xiàn),它在2008年就已經(jīng)作為谷歌的社會福利項目面世,但對企業(yè)和政府來說它是一個發(fā)掘大數(shù)據(jù)潛在價值的優(yōu)秀范例。
為何要用網(wǎng)絡(luò)搜索查詢更能追蹤世界范圍內(nèi)的流感病情?畢竟這已經(jīng)是全球健康部門如CDC正在做的事。谷歌的回答是:沒錯,但Google Flu Trends通過對聚合搜索的結(jié)果進行分析,可以比這些機構(gòu)更快速地偵測到疾病的爆發(fā)。而且,盡管衛(wèi)生報告每周都得到更新,但報告僅限于單個國家。Google Flu Trends卻有著幾近涵蓋全球的視角:它在任何人們使用Google搜索的地點收集數(shù)據(jù)。更重要的是,由于它是每日更新的,因而它向人們傳遞更即時的消息。
Google.org是這樣解釋搜索查詢和流感流行之間的關(guān)系的:“我們發(fā)現(xiàn)搜索流感有關(guān)的話題的人數(shù)和事實上擁有流感癥狀的人數(shù)之間存在著緊密的聯(lián)系。當然,并不是所有搜索"流感"的人都事實上患病,但當所有流感有關(guān)的搜索查詢加到一起,我們就可以得到一套新的評估模式。”
通過對查詢總數(shù)和來自于傳統(tǒng)流感監(jiān)測系統(tǒng)的數(shù)據(jù)進行比較,Google發(fā)現(xiàn)流感有關(guān)的搜索查詢(毫不令人驚奇地)在流感季節(jié)很普遍。并且通過計算這些查詢的數(shù)量,Google可以進而估計在使用Google搜索引擎的世界各個地方流感的活動情況。
Google通過比較現(xiàn)有的來自搜索數(shù)據(jù)的估計和某一特定地區(qū)官方歷史上的流行性感冒信息,來判定流感活動的等級強烈,高,適中,低或者最小。例如,在2013年1月8日,它將美國的流感活動等級列為“強烈”,這項判定與CDC(Centers for Disease Control,美國疾病防控中心)的報告一致。CDC報告聲稱國家的大部分地區(qū)還在爆發(fā)嚴重的流感疫情。
Flu Trends使用來自Google服務(wù)器日志上的IP地址信息來判定用戶的查詢來源。Google不將Flu Trends定位為一項傳統(tǒng)的衛(wèi)生機構(gòu)數(shù)據(jù)的替代品,正相反,Google把它作為一項可以幫助公共衛(wèi)生官員早期偵測疾病爆發(fā)的補充物,并且希望能夠限制疾病感染的人數(shù)。例如,在2008年1月,Google的Flu Trends偵測到美國大西洋(600558,股吧)沿岸中部地區(qū)流感的活動顯著增加。作為比較,兩周后的CDC發(fā)布的報告仍未顯示該項增加。
傳統(tǒng)的疾病監(jiān)控報告通常來自醫(yī)生和衛(wèi)生專家。他們是優(yōu)秀的人口數(shù)據(jù)來源,而這些數(shù)據(jù),衛(wèi)生當局無法從搜索查詢中獲得。
當前,F(xiàn)lu Trends的觸角還未達到真正的遍及全球。Google向世界上超過25個國家提供流行性感冒評估,涵蓋南北美,歐洲,澳洲和部分亞洲地區(qū)。然而,它不包括面向中國、印度、印度尼西亞、中東和大部分非洲地區(qū)(除南非之外)的流行性感冒評估。
當然,大部分搜索用戶不希望他們每次(可能)生病都遭到Google跟蹤。這個搜索巨頭通過對每周查詢進行聚合匿名統(tǒng)計來解決這些隱私擔憂。