那么什么是正確的答案?這里是一個對于“大數(shù)據(jù)”的解釋,我相信,適用于任何人:
鑒于數(shù)據(jù)庫技術(shù)無法擴大規(guī)模,已成為了業(yè)務(wù)邏輯的一種阻礙。這種邏輯使用效率不高的方法來訪問和操縱數(shù)據(jù)。但這些低下的效率往往被硬件的增長速度和能力,以及存儲的價格下降所掩蓋。當(dāng)然,這種低效直到2007年左右,都沒有人真正注意或關(guān)心。
效率低下,最終納入開放新的應(yīng)用程序時,發(fā)現(xiàn)大量數(shù)據(jù)推斷的重要成果(經(jīng)常是分析的一種)的新的和實際用途。我們總是用傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)的方法,不能擴大。大數(shù)據(jù)技術(shù)的建立是為了使應(yīng)用程序可以擴大,但更重要的一點,其解決了過去30年來一直困擾我們的系統(tǒng)效率低下的問題。效率低下與尺寸或規(guī)模幾乎沒有關(guān)系,而是源于懶惰,我們更傾向于一拖再拖的不解決這些不愉快的細(xì)節(jié),直到他們真正成為我們的麻煩。
從本質(zhì)上講,大數(shù)據(jù)工具解決的是大量數(shù)據(jù)的存儲、訪問、操縱和分析的方式。他們代替了傳統(tǒng)數(shù)據(jù)庫。至少,代替了存儲系統(tǒng)(Hadoop),但他們也可以代替存取方法。