- 數(shù)據(jù)量巨大:人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB(1PB=210TB),而歷史上全人類說過的所有的話的數(shù)據(jù)量大約5EB(1EB=210PB)。當(dāng)前,典型個(gè)人計(jì)算機(jī)硬盤的容量為TB量級(jí),而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級(jí),如此龐大的數(shù)據(jù)量群,分析它們的難度可想而知,因此需要大量的大數(shù)據(jù)解決方案。
- 價(jià)值密度低:這也是當(dāng)今大數(shù)據(jù)背景下需要解決的一個(gè)難題,價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比,如果看一小時(shí)視頻,在連續(xù)不間斷的監(jiān)控中有用數(shù)據(jù)的時(shí)間可能會(huì)很短,甚至是幾秒鐘,那么強(qiáng)大的數(shù)據(jù)計(jì)算機(jī)的算法就需要非常迅速地完成對(duì)數(shù)據(jù)的“提純”。
- 數(shù)據(jù)類型多:這點(diǎn)不用多解釋,數(shù)據(jù)類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等。
- 處理速度快:據(jù)IDC研究機(jī)構(gòu)報(bào)告顯示,預(yù)計(jì)到2020年,全球數(shù)據(jù)使用量將達(dá)到35.2ZB(1ZB=210EB),分析這么大的數(shù)據(jù),就需要設(shè)備對(duì)數(shù)據(jù)的處理速度有很大的提升。
(3)大數(shù)據(jù)給企業(yè)謀福利
2012年3月,美國宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,借以增強(qiáng)收集海量數(shù)據(jù)、分析萃取信息的能力。2012年瑞士達(dá)沃斯論壇上發(fā)布的《大數(shù)據(jù)大影響》報(bào)告稱,數(shù)據(jù)已成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣或黃金一樣,許多國家政府更是把大數(shù)據(jù)上升到戰(zhàn)略層面。
(4)全球大數(shù)據(jù)市場發(fā)展趨勢
對(duì)企業(yè)來講,在大數(shù)據(jù)背景下數(shù)據(jù)資產(chǎn)將會(huì)取代人才成為各個(gè)公司和行業(yè)的重要載體,可以有效地幫助企業(yè)完成業(yè)務(wù)的操作、流程的制定以及公司各項(xiàng)工作的運(yùn)營和監(jiān)督,通過對(duì)數(shù)據(jù)的分析,幫助企業(yè)領(lǐng)導(dǎo)者進(jìn)行各項(xiàng)決策。
大數(shù)據(jù)對(duì)企業(yè)的核心資產(chǎn)也進(jìn)行了重塑,企業(yè)必須熟悉和用好海量的數(shù)據(jù),而互聯(lián)網(wǎng)行業(yè)已提早感受到了大數(shù)據(jù)帶來的深切變化。一些互聯(lián)網(wǎng)企業(yè)已經(jīng)完成了核心競爭力的重新定義。
(5)信息安全不容小視
大數(shù)據(jù)成為網(wǎng)絡(luò)攻擊的顯著目標(biāo),在網(wǎng)絡(luò)空間,大數(shù)據(jù)是更容易被“發(fā)現(xiàn)”的大目標(biāo)。一方面,大數(shù)據(jù)意味著海量的數(shù)據(jù),也意味著更復(fù)雜、更敏感的數(shù)據(jù),這些數(shù)據(jù)會(huì)吸引更多的潛在攻擊者。另一方面,數(shù)據(jù)的大量匯集,使得黑客成功攻擊一次就能獲得更多數(shù)據(jù),無形中降低了黑客的進(jìn)攻成本,增加了“收益率”。
如此龐大的數(shù)據(jù)中包含了很多個(gè)人信息,甚至是隱私信息,數(shù)據(jù)的集中存儲(chǔ)就勢必帶來大量數(shù)據(jù)丟失和破壞的風(fēng)險(xiǎn),一些敏感數(shù)據(jù)的所有權(quán)和使用權(quán)并沒有明確界定,很多基于大數(shù)據(jù)的分析都未考慮到其中涉及的個(gè)體隱私問題。
許多企業(yè)對(duì)大數(shù)據(jù)的認(rèn)知程度不同,因此致使企業(yè)在大數(shù)據(jù)管理和運(yùn)營中會(huì)出現(xiàn)不妥之處,安全防護(hù)手段的更新升級(jí)速度無法跟上數(shù)據(jù)量非線性增長的步伐,就會(huì)暴露大數(shù)據(jù)安全防護(hù)的漏洞。
大數(shù)據(jù)技術(shù)很容易成為黑客的攻擊手段,在企業(yè)用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術(shù)獲取商業(yè)價(jià)值的同時(shí),黑客也在利用這些大數(shù)據(jù)技術(shù)向企業(yè)發(fā)起攻擊。黑客會(huì)最大限度地收集更多有用信息。
傳統(tǒng)的檢測是基于單個(gè)時(shí)間點(diǎn)進(jìn)行的基于威脅特征的實(shí)時(shí)匹配檢測,而高級(jí)可持續(xù)攻擊是一個(gè)實(shí)施過程,無法被實(shí)時(shí)檢測。此外,大數(shù)據(jù)的價(jià)值低密度性,使得安全分析工具很難聚焦在價(jià)值點(diǎn)上,黑客可以將攻擊隱藏在大數(shù)據(jù)中。
(6)切忌一哄而上
中國工程院院士鄔賀銓曾建議,中國發(fā)展大數(shù)據(jù)需要盡快制定信息保護(hù)法與信息公開法,既要鼓勵(lì)面向群體而且服務(wù)于社會(huì)的數(shù)據(jù)挖掘,又要防止針對(duì)個(gè)體侵犯隱私的行為,既要提倡數(shù)據(jù)共享又要防止數(shù)據(jù)被濫用。
據(jù)了解,2010年中國新存儲(chǔ)的數(shù)據(jù)為250PB,僅為日本的60%,北美的7%。我國還并未重視對(duì)大數(shù)據(jù)的利用和存儲(chǔ),一些數(shù)據(jù)在一定時(shí)間內(nèi)白白浪費(fèi)了。一些部門和機(jī)構(gòu)擁有大量數(shù)據(jù),但以鄰為壑,寧愿自己不用也不愿提供與有關(guān)部門共享,導(dǎo)致信息不完整或重復(fù)投資。
(7)國內(nèi)大數(shù)據(jù)發(fā)展
鄔賀銓說,我國對(duì)大數(shù)據(jù)的信息安全保護(hù)也不夠重視。2012年中國的數(shù)據(jù)存儲(chǔ)量達(dá)到364EB,其中55%的數(shù)據(jù)需要一定程度的保護(hù),然而目前只有不到一半的數(shù)據(jù)得到保護(hù)。 更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):