最近一段時間以來,大數(shù)據(jù)這個概念被吹噓的天花亂墜,仿佛你要是不說大數(shù)據(jù)就落伍了。繼云計算之后,大數(shù)據(jù)已然成為IT行業(yè)的熱點(diǎn)。
作為學(xué)習(xí)統(tǒng)計專業(yè)的70后,因?yàn)闀r代的限制,并不敢過多的談基于數(shù)據(jù)庫的挖掘,但多年的工作經(jīng)驗(yàn)也有一些體會。作為統(tǒng)計的基礎(chǔ)的抽樣方法仍然是最好的數(shù)據(jù)分析的初步,基于科學(xué)的抽樣得到的結(jié)論不會比泛數(shù)據(jù)的運(yùn)算更不準(zhǔn)確。
這幾年,全球信息產(chǎn)業(yè)整個都呈現(xiàn)出一種唯技術(shù)化的傾向,科技公司以自己的能力展示給社會強(qiáng)大的力量與財富制造水平,讓越來越多的人注重工具、注重算法、注重操作,而放棄了最基本的分析邏輯和思維方法。
隨著物聯(lián)網(wǎng)、云計算和各種基于個人信息終端的移動互聯(lián)網(wǎng)的應(yīng)用的快速發(fā)展,數(shù)據(jù)量呈現(xiàn)出爆發(fā)式增長,一年幾乎1.8Z的數(shù)據(jù)已經(jīng)讓我們這些凡夫俗子望洋興嘆。在這種情況下,無論是產(chǎn)品的設(shè)計、客戶的甄別、營銷的策劃都需要從大海中撈針。
由此,我們是應(yīng)該想盡辦法去撈盡每一片海洋呢,還是想辦法用智慧去對待呢?
世界應(yīng)該是辯證的統(tǒng)一,越是數(shù)據(jù)量的加大,我們越需要的并不是對這些大數(shù)據(jù)進(jìn)行計算的能力,相反,我們應(yīng)該提升的是對這些數(shù)據(jù)進(jìn)行提煉簡化的水平。
可以確定的說,我們從來就生活在一個大數(shù)據(jù)的世界中,無論是原始社會還是現(xiàn)代社會,變化的只是信息存在和顯現(xiàn)的方式而已。對于幾千年前的孔子老子亞里士多德等等來說,星空是大數(shù)據(jù)、河流是大數(shù)據(jù)、雖然他們手中沒有上天的飛船下地的探頭,但仍然不阻礙其研究分析的能力,人類社會并沒有變得混亂和愚蠢。
用數(shù)據(jù)庫軟件來代替數(shù)據(jù)分析,用模型和工具來代替思維和頭腦,一頭扎入浩如煙海的數(shù)據(jù)中,得到的不會是清醒的判斷,只會是混沌的結(jié)論。