誤區(qū)四:把“大數(shù)據(jù)”當(dāng)作“小數(shù)據(jù)”用,分析采用部分局部數(shù)據(jù)。
經(jīng)濟(jì)社會(huì)中,如果取得的數(shù)據(jù)樣本有限,就需要確立有效的分析框架,建立模型,確立函數(shù)關(guān)系,做回歸分析。然而,如果樣本不僅是充分的,而且是完整的,是全量的,那么數(shù)據(jù)分析就要擺脫既有的舊模式了。從全樣本的大數(shù)據(jù)中,收窄樣本數(shù)量,只選取部分樣本用來分析,是一種縮量的方法,縮量樣本分析后的結(jié)論又要適用于總量,這就是對(duì)大數(shù)據(jù)的“小用”。
舉例來說,如果能夠獲得一個(gè)城鎮(zhèn)全部機(jī)動(dòng)車以及全部外埠入城車輛的運(yùn)行狀況,我們就可依所設(shè)議題來直接抓取數(shù)據(jù),獲得結(jié)論。抽樣建模分析及其回歸分析,就不僅累贅,而且極有可能鑄成大錯(cuò)。簡(jiǎn)單來說,大數(shù)據(jù),就是扳手指頭數(shù)不過來的狀況,交給機(jī)器與程序去“扳”,不僅數(shù)得過來,而且數(shù)出來了。大數(shù)據(jù)往往更多地可以直接抓取并使用,而非在數(shù)理化、模型化、函數(shù)化等“加工”后再使用。
大數(shù)據(jù)具有完整性和全局性的特質(zhì),如果采用部分局部數(shù)據(jù),然后試圖得出超出部分局部數(shù)據(jù)范圍的結(jié)論,這種既有的思維慣性,并不適用于大數(shù)據(jù)的邏輯和現(xiàn)實(shí)。大數(shù)據(jù)不能當(dāng)作小數(shù)據(jù)用,小數(shù)據(jù)終歸拼不出完整的大數(shù)據(jù)。