或許我們需要的是“智能遺忘”:讓我們的工具變得更會(huì)放棄最近的過去,從而在整體視角上保持更大的連續(xù)性。這有點(diǎn)像是重新組織一本相片簿,盡管加上了更多的 數(shù)學(xué)方法。什么時(shí)候兩百萬(wàn)張照片的價(jià)值比兩千張照片更低?什么時(shí)候較大的樣品覆蓋的范圍反而較小?什么時(shí)候細(xì)節(jié)水平能提供有用的質(zhì)疑證據(jù),而不是虛假的自信?
許多數(shù)據(jù)集是無(wú)法縮減的,而且在完整的情況下才最寶貴,比如,基因序列、人口統(tǒng)計(jì)學(xué)數(shù)據(jù)、地理和物理學(xué)的原始觀測(cè)數(shù)據(jù)等??茖W(xué)性越弱,數(shù)據(jù)規(guī)模與數(shù)據(jù)的質(zhì)量更可能呈現(xiàn)負(fù)相關(guān),此時(shí)時(shí)間本身就成為更加重要的過濾工具。我們?nèi)绻蛔屑?xì)選擇過去保存下來(lái)的有價(jià)值、有意義的東西,那它們就會(huì)悄無(wú)聲息地淹沒在如今日益增長(zhǎng)的噪音之中。
今天的企業(yè)、個(gè)人和政府機(jī)構(gòu)都能夠獲得比以往(甚至就在幾年前)大許多數(shù)量級(jí)的數(shù)據(jù),但這些數(shù)據(jù)并沒有獲得更多的處理時(shí)間。利用越來(lái)越高效的工具,董事會(huì)成員、首席執(zhí)行官、政府官員等決策者可以就已有的信息提出更有意義的問題。單純的堆積不是問題的答案。在一個(gè)數(shù)據(jù)量越來(lái)越大的時(shí)代,如何選擇不知道哪些事情,與選擇做什么事情一樣重要。