1 大數(shù)據(jù)發(fā)展概述
當(dāng)今是一個(gè)數(shù)據(jù)爆發(fā)增長(zhǎng)的時(shí)代。移動(dòng)互聯(lián)網(wǎng)、移動(dòng)終端和數(shù)據(jù)傳感器的出現(xiàn),使數(shù)據(jù)以超出人們想象的速度快速增長(zhǎng)。據(jù)調(diào)查機(jī)構(gòu)估測(cè),數(shù)據(jù)數(shù)量一直在快速增加,這個(gè)速度不僅是指數(shù)據(jù)流的增長(zhǎng),而且還包括全新的數(shù)據(jù)種類的增多。目前數(shù)據(jù)容量增長(zhǎng)的速度,已經(jīng)大大超過了硬件技術(shù)的發(fā)展速度,并正在引發(fā)數(shù)據(jù)存儲(chǔ)和處理的危機(jī)。據(jù)統(tǒng)計(jì),2013年全球產(chǎn)生的數(shù)據(jù)達(dá)到3.5澤字節(jié),到2020年產(chǎn)生的數(shù)量將增至44澤字節(jié)。
“大數(shù)據(jù)”一詞來自于未來學(xué)家托夫勒于1980年所著的《第三次浪潮》。最早開始對(duì)大數(shù)據(jù)進(jìn)行應(yīng)用探索的是2005年雅虎公司的Hadoop項(xiàng)目。Hadoop其最初只是用來解決網(wǎng)頁(yè)搜索問題的一個(gè)項(xiàng)目,后被Apache Software Foundation公司引入并成為開源應(yīng)用。Hadoop是由多個(gè)軟件產(chǎn)品組成的一個(gè)生態(tài)系統(tǒng),這些軟件產(chǎn)品共同實(shí)現(xiàn)全面功能和靈活的大數(shù)據(jù)分析。
世界上許多國(guó)家都已經(jīng)認(rèn)識(shí)到了大數(shù)據(jù)所蘊(yùn)含的重要戰(zhàn)略意義,紛紛開始在國(guó)家層面進(jìn)行戰(zhàn)略部署,以迎接大數(shù)據(jù)技術(shù)革命正在帶來的新的機(jī)遇和挑戰(zhàn)。以美國(guó)為代表的發(fā)達(dá)國(guó)家在推進(jìn)大數(shù)據(jù)上已經(jīng)形成了從發(fā)展戰(zhàn)略、法律框架到行動(dòng)計(jì)劃的完整布局。
2 全球各國(guó)大數(shù)據(jù)的發(fā)展現(xiàn)狀
美國(guó)在《大數(shù)據(jù)研究和發(fā)展倡議》中,提出將通過收集龐大而復(fù)雜的數(shù)字資料,從中獲得知識(shí)和洞見,以提升能力。并協(xié)助加速在科學(xué)、工程上發(fā)現(xiàn)的步伐,強(qiáng)化美國(guó)國(guó)土安全,轉(zhuǎn)變教育和學(xué)習(xí)模式。根據(jù)這一計(jì)劃,美國(guó)希望利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)在多個(gè)領(lǐng)域的突破,包括科研教學(xué)、環(huán)境保護(hù)、工程技術(shù)、國(guó)土安全、生物醫(yī)藥等。其中具體的研發(fā)計(jì)劃涉及了美國(guó)國(guó)家科學(xué)基金會(huì)、國(guó)家衛(wèi)生研究院、國(guó)防部、能源部、國(guó)防部高級(jí)研究局、地質(zhì)勘探局等6個(gè)聯(lián)邦部門和機(jī)構(gòu)。
擁有世界第二多人口的印度,近兩年也持續(xù)運(yùn)用大數(shù)據(jù),期許打造出一個(gè)更便利、更親民的智慧城市。印度全國(guó)軟件與服務(wù)企業(yè)協(xié)會(huì)(Nasscom)預(yù)計(jì),印度大數(shù)據(jù)行業(yè)規(guī)模在三年內(nèi)將快速增長(zhǎng),是當(dāng)前規(guī)模的六倍,同時(shí)還是全球大數(shù)據(jù)行業(yè)平均增長(zhǎng)速度的兩倍。對(duì)于印度的整個(gè)IT行業(yè)來說,大數(shù)據(jù)時(shí)代的到來會(huì)創(chuàng)造更多更新的機(jī)遇。