Stack Overflow近日宣布,通過谷歌BigQuery提供它的數(shù)據(jù)集。開發(fā)人員可以使用平常的SQL語句查詢完整的Stack Overflow數(shù)據(jù)集,包括帖子、投票、標(biāo)簽和徽章。使用BigQuery的REST API,開發(fā)人員可以根據(jù)需要使用他們自選的工具導(dǎo)出數(shù)據(jù)。BigQuery上的數(shù)據(jù)集支持聯(lián)合查詢,開發(fā)人員使用普通的SQL就可以跨領(lǐng)域獲得有用的見解。
除了Stack Overflow的數(shù)據(jù)集以外,BigQuery還支持對Hacker News數(shù)據(jù)集和GitHub數(shù)據(jù)集的訪問,這兩個數(shù)據(jù)集連同Stack Overflow數(shù)據(jù)集可以提供有用的見解。BigQuery近日還圍繞紐約市的數(shù)據(jù)增加了三個數(shù)據(jù)集,分別是關(guān)于機(jī)動車碰撞、城市自行車旅行及311非緊急市政服務(wù)電話請求。BigQuery之前已經(jīng)有一個數(shù)據(jù)集,其中包含2009年到2015年紐約市的每一次出租車和豪華轎車旅行,上述三個數(shù)據(jù)集對此是一個補(bǔ)充。
當(dāng)前,BigQuery還有其他可用的數(shù)據(jù)集,其中包括氣象信息(部分?jǐn)?shù)據(jù)遠(yuǎn)至1763年)、醫(yī)療數(shù)據(jù)、350萬數(shù)字化圖書、一個包含元數(shù)據(jù)并標(biāo)注了900萬URL的圖像數(shù)據(jù)集、美國國稅局及美國職棒大聯(lián)盟的數(shù)據(jù)。還有一個數(shù)據(jù)集包含了世界各地的新聞和事件,每15分鐘更新一次。該數(shù)據(jù)集是由GDELT項(xiàng)目提供的。此外,BigQuery還包含Personal Genome項(xiàng)目提供的Genomics數(shù)據(jù)集、Wikipedia頁面訪問量數(shù)據(jù)以及將近20億條Reddit評論。