我們正在步入“大數(shù)據(jù)”時(shí)代。據(jù)IDC監(jiān)測(cè)統(tǒng)計(jì)結(jié)果,2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB相當(dāng)于13億中國(guó)人每人一臺(tái)1000G容量的電腦所儲(chǔ)存的信息量),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍。大數(shù)據(jù)的發(fā)展受益于以下幾個(gè)方面:(1)摩爾定律。摩爾定律內(nèi)容是微處理器的性能每隔18個(gè)月提高一倍,或價(jià)格下降一半,其核心是伴隨著硬件性能的高速提升同時(shí)會(huì)降低硬件成本,這為大數(shù)據(jù)的儲(chǔ)存在硬件和成本方面提供了可能。(2)云計(jì)算/普適計(jì)算。云計(jì)算提升了大數(shù)據(jù)處理的效率,并有效降低了處理成本。(3)社交網(wǎng)絡(luò)。社交網(wǎng)絡(luò)的發(fā)展大大拓深了數(shù)據(jù)的維度和容量。
互聯(lián)網(wǎng)和大數(shù)據(jù)是信息技術(shù)發(fā)展催生的一對(duì)孿生子?;ヂ?lián)網(wǎng)能夠方便、準(zhǔn)確地記錄用戶相關(guān)數(shù)據(jù),引領(lǐng)世界進(jìn)入數(shù)據(jù)爆炸時(shí)代?;ヂ?lián)網(wǎng)的發(fā)展大大加快了數(shù)據(jù)積累速度,而且產(chǎn)生了大量的半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),這也促進(jìn)了相關(guān)大數(shù)據(jù)分析技術(shù)的發(fā)展。同時(shí),互聯(lián)網(wǎng)也是大數(shù)據(jù)分析應(yīng)用最為廣泛的一個(gè)領(lǐng)域之一,比如搜索引擎的技術(shù)基礎(chǔ)就是基于大數(shù)據(jù)分析的算法設(shè)計(jì),面向互聯(lián)網(wǎng)用戶的精準(zhǔn)營(yíng)銷也是以大數(shù)據(jù)分析為依據(jù)。
數(shù)據(jù)是網(wǎng)站的一種重要財(cái)富??梢哉f(shuō),誰(shuí)能更好地掌握和使用數(shù)據(jù),誰(shuí)就把握住了互聯(lián)網(wǎng)的未來(lái)。因此,一些大的互聯(lián)網(wǎng)公司對(duì)數(shù)據(jù)方面投入了大量的人力物力,如阿里巴巴就把數(shù)據(jù)戰(zhàn)略提升到與平臺(tái)戰(zhàn)略(天貓、淘寶)、金融戰(zhàn)略(支付寶)相提并論的位置。伴隨著互聯(lián)網(wǎng)相關(guān)數(shù)據(jù)的積累,如何正確、有效地對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析挖掘,成為互聯(lián)網(wǎng)公司面臨的一個(gè)重大挑戰(zhàn)。同時(shí),數(shù)據(jù)應(yīng)用還涉及用戶隱私問(wèn)題,如何正當(dāng)、合理地使用相關(guān)數(shù)據(jù)也是一個(gè)需要厘清的問(wèn)題。這些問(wèn)題將在以后進(jìn)行較為詳細(xì)的探討。