隨著美國硅谷開始挖掘全球的數(shù)據(jù),人們沒有忘記大數(shù)據(jù)世界是如此的復(fù)雜。特別是非洲在世界上許多數(shù)據(jù)集上呈現(xiàn)出一個(gè)明顯的空白時(shí),但這個(gè)差距究竟有多大?
Facebook公司創(chuàng)始人馬克•扎克伯格表示,F(xiàn)acebook的原始熱門主題Feed幾乎完全沒有來自非洲的新聞來源,這意味著幾乎不可能有來自非洲大陸的Facebook公司用戶,除非他們被美國媒體覆蓋,才會(huì)有非洲大陸的大多數(shù)事件。
其余的社交媒體的情況也不是更好,Twitter也沒有真正進(jìn)入整個(gè)非洲大陸。這就很有問題因?yàn)槎x大數(shù)據(jù)革命的“社交媒體監(jiān)控”領(lǐng)域的大部分都是基Twitte的firehose,因此這意味著將錯(cuò)過非洲和中東地區(qū)的市場。
2012-2014年期間Twitter大量活動(dòng)的地點(diǎn)
當(dāng)涉及到網(wǎng)絡(luò)搜索引擎,其市場似乎沒有任何更好的發(fā)展。Google公司的趨勢(shì)小組在2016年6月生成了一張地圖,顯示了美國人在2016年搜索全球的每個(gè)國家/地區(qū)的頻率。非洲則獨(dú)樹一幟,成為搜索次數(shù)最少的大陸。
美國人在Google上針對(duì)世界各國搜索的頻率的地圖
這些地圖清楚地說明了人們根本不談?wù)摲侵蓿覜]有足夠的興趣去探索非洲。這就提出了這樣一個(gè)問題:新聞媒體是否同樣不覆蓋非洲大陸,或者是否有大量報(bào)道,但它根本沒有與人們產(chǎn)生共鳴。
以下的地圖顯示了2015年3月“紐約時(shí)報(bào)”和BBC報(bào)道中提到的所有地點(diǎn)。雖然非洲當(dāng)然被提及,但這個(gè)地圖清楚地表明,非洲并不是兩個(gè)媒體報(bào)道的的優(yōu)先事項(xiàng)。
當(dāng)然,網(wǎng)絡(luò)不是唯一的新聞來源,電視新聞仍然在美國發(fā)揮著關(guān)鍵作用。然而,如下圖所示,電視新聞在其對(duì)非洲的覆蓋不是太好。如果人們觀察每個(gè)月在美國電視新聞上提到的所有位置的地圖,人們多數(shù)對(duì)非洲缺乏興趣在,往往多個(gè)月都沒有提到一個(gè)特定國家。
事實(shí)上,下面的地圖與Google趨勢(shì)地圖有著驚人的相似之處,美國人在哪些國家搜索最多。這并不能告訴人們?nèi)狈γ襟w關(guān)注導(dǎo)致缺乏搜索興趣,反之亦然,但是相似之處是顯著的??傊?,媒體沒有覆蓋非洲,人們并沒有尋找非洲事物的興趣。
即使是擁有豐富的資源的美國情報(bào)界,似乎對(duì)非洲沒有什么興趣。在1994-2004年期間,美國OSINT機(jī)構(gòu)(負(fù)責(zé)監(jiān)測(cè)世界各地的新聞和其他“開放”資源)大部分通過歐洲媒體(如法新社)的報(bào)道觀察了非洲大陸,并幾乎沒有實(shí)際監(jiān)測(cè)非洲各國的站點(diǎn)。事實(shí)上,這是美國政府資助的監(jiān)測(cè)項(xiàng)目錯(cuò)過了埃博拉疫情的第一次爆發(fā)的原因之一,因?yàn)檫@些早期警報(bào)標(biāo)志首先出現(xiàn)在美國的法語廣播電臺(tái)。
如果人們不在談?wù)摲侵?,并不在網(wǎng)絡(luò)尋找它時(shí),那些西方網(wǎng)絡(luò)和電視新聞媒體似乎并不覆蓋非洲大陸。在擁有撒哈拉沙漠,人口密度低的非洲,事實(shí)上有相當(dāng)多的媒體和媒體報(bào)道的事件,而這些也被傳統(tǒng)的西方網(wǎng)站和社交媒體錯(cuò)過。
將這些結(jié)合在一起,人們看到“大數(shù)據(jù)”提供了令人難以置信全球社會(huì)的一瞥,非洲大陸十分缺乏人們的關(guān)注,而對(duì)于傳統(tǒng)的大數(shù)據(jù)集,如社交媒體的分析捕獲非洲國家的地方事件和觀點(diǎn)則非常糟糕。然而,由于大數(shù)據(jù)的發(fā)展,以及機(jī)器翻譯等技術(shù)的應(yīng)用,有可能使非洲大陸重新回到“大數(shù)據(jù)”分析的視野。數(shù)據(jù)科學(xué)界需要的是更加重視確保人們使用的數(shù)據(jù)集在地理上代表整個(gè)世界的努力方向。