這些日子以來,大數(shù)據(jù)似乎很時髦。它的確很大,很新,它和Hadoop有關(guān),而且一般來說都在公有云中。如今每周都會有新的企業(yè)和新的云產(chǎn)品出現(xiàn),都承諾最終可以控制企業(yè)的數(shù)據(jù)。它們都在兜售同一個想法:企業(yè)可以通過公有云的彈性,遷移到幾乎“沒有容量限制的”PB級數(shù)據(jù)庫上去。
而現(xiàn)實跟這樣的炒作則相差甚遠。當組織試圖將企業(yè)的數(shù)據(jù)整合到公有云中的大型數(shù)據(jù)庫上時,它們卻忽視了一些技術(shù)方面的現(xiàn)實。
首先,大數(shù)據(jù)意味著大遷移的挑戰(zhàn)。從企業(yè)獲取數(shù)據(jù)遷往公有云可能是成問題的。盡管企業(yè)每天都要在開放的互聯(lián)網(wǎng)上搬運數(shù)十萬條數(shù)據(jù)記錄,但是在很多大數(shù)據(jù)的場合下,我們所談?wù)摰膮s是數(shù)百萬條數(shù)據(jù)記錄如何從現(xiàn)有的企業(yè)系統(tǒng)中遷出、轉(zhuǎn)換、加密的問題。
這么做你很快就會碰上帶寬的限制。實際上,很多企業(yè)都是通過聯(lián)邦快遞傳送U盤給其公有云提供商的。
其次,盡管在云中肯定會實施各種安全措施,但是一般來說,在企業(yè)內(nèi)部的系統(tǒng)或私有云中處理數(shù)據(jù)級別的安全還是要便宜得多。在很多場合下,企業(yè)的安全模式和安全技術(shù)成本都不是很高。舉例來說,在公有云中,企業(yè)必須對其數(shù)據(jù)進行加密,而在自己的數(shù)據(jù)中心內(nèi)則無此必要。同樣,把數(shù)據(jù)保留在本地,法規(guī)遵從一般來說也更容易,成本也更低。
順便說一句,我并不是說大數(shù)據(jù)完全不適合公有云,而是說你必須要考慮所有的技術(shù)問題。再加上其他的架構(gòu)問題,你必須具體問題具體分析。