大數(shù)據(jù)如何改變傳統(tǒng)數(shù)據(jù)的運作模式?
與傳統(tǒng)的數(shù)據(jù)應用相比,大數(shù)據(jù)在四個方面(“4C”)改變了傳統(tǒng)數(shù)據(jù)的運作模式,為機構帶來了新的價值。
1、 數(shù)據(jù)質(zhì)量的兼容性:大數(shù)據(jù)通過“量”提升了數(shù)據(jù)分析對“質(zhì)”的寬容度
在“小數(shù)據(jù)”時代,數(shù)據(jù)的獲取門檻相對較高,這就導致“樣本思維”占據(jù)統(tǒng)治地位。人們大多是通過抽樣和截取的方式來捕獲數(shù)據(jù)。同時,人們分析數(shù)據(jù)的手段和能力也相對有限。為了保證分析結果的準確性,人們通常會有意識地收集可量化的、清潔的、準確的數(shù)據(jù),對數(shù)據(jù)的“質(zhì)”提出了很高的要求。而在大數(shù)據(jù)時代,“全量思維”得到了用武之地,人們有條件去獲取多維度、全過程的數(shù)據(jù)。但在海量數(shù)據(jù)出現(xiàn)后,數(shù)據(jù)的清洗與驗證幾乎成為了不可能的事。正是這樣的困境催生了數(shù)據(jù)應用的新視角與新方法。類似于分布式技術的新算法使數(shù)據(jù)的“量”可以彌補“質(zhì)”的不足,從而大大提升了數(shù)據(jù)分析對于數(shù)據(jù)質(zhì)量的兼容能力。
2、大數(shù)據(jù)使技術與算法從“靜態(tài)”走向“持續(xù)”
在大數(shù)據(jù)時代,對“全量”的追求使“實時”變得異常重要,而這一點也不僅僅只體現(xiàn)在數(shù)據(jù)采集階段。在云計算、流處理和內(nèi)存分析等技術的支撐下,一系列新的算法使實時分析成為可能。人們還可以通過使用持續(xù)的增量數(shù)據(jù)來優(yōu)化分析結果。在這些因素的共同作用下,人們一貫以來對“因果關系”的追求開始松動,而“相關關系”正在逐步獲得一席之地。