大數(shù)據(jù)對于很多企業(yè)來說,并不意味著機(jī)遇或是商業(yè)上的無限潛力,在他們能夠很好地管理數(shù)據(jù)之前,大數(shù)據(jù)只意味著風(fēng)險(xiǎn)和無窮無盡的煩惱。
在大數(shù)據(jù)的三個(gè)重要議題:非結(jié)構(gòu)化數(shù)據(jù)超越結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)量激增和對結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行商業(yè)分析之中,前兩個(gè)議題的解決是第三個(gè)議題能夠得以實(shí)現(xiàn)的基礎(chǔ)和前提,沒有良好的數(shù)據(jù)存儲(chǔ)、保護(hù)、遷移和梳理,想要把數(shù)據(jù)進(jìn)行分析無異于天方夜譚——數(shù)據(jù)從何而來?又如何分析毫無結(jié)構(gòu)、頭緒的非結(jié)構(gòu)化數(shù)據(jù)?企業(yè)首要做的就是降低在面對大數(shù)據(jù)的時(shí)候的“數(shù)據(jù)量風(fēng)暴和風(fēng)險(xiǎn)”。
但問題并不像表面上看那么簡單——這不是存儲(chǔ)容量的又一場游戲——而是對企業(yè)存儲(chǔ)全方位的風(fēng)險(xiǎn)包圍和警鐘,除了容量危機(jī)之外,企業(yè)在大數(shù)據(jù)時(shí)代面臨著極大的管理風(fēng)險(xiǎn),這其中包括了日積月累的異構(gòu)存儲(chǔ)架構(gòu)與復(fù)雜環(huán)境的“僵硬架構(gòu)”、有限的存儲(chǔ)管理人員無法應(yīng)對越來越復(fù)雜的存儲(chǔ)環(huán)境、日益增長的數(shù)據(jù)帶來的緊張預(yù)算,當(dāng)然,我們也要看到隨著數(shù)據(jù)量的激增與數(shù)據(jù)類型復(fù)雜度的增加,對于企業(yè)的法規(guī)遵從也帶來越來越大的影響。
可以說,在大數(shù)據(jù)對容量與數(shù)據(jù)分析系統(tǒng)造成的挑戰(zhàn)與壓力背后,是大數(shù)據(jù)對企業(yè)存儲(chǔ)管理帶來的極大風(fēng)險(xiǎn)——即便是簡單的數(shù)據(jù)與存儲(chǔ)工作都會(huì)產(chǎn)生風(fēng)險(xiǎn),如果我們再來看看我們要對數(shù)據(jù)進(jìn)行哪些操作,就會(huì)覺得這個(gè)問題更加可怕:備份、恢復(fù)、快照、遷移、復(fù)制、遠(yuǎn)程復(fù)制、重復(fù)數(shù)據(jù)刪除、容量回收、歸檔、加密解密——僅僅粗略算來,對數(shù)據(jù)的操作就不下10項(xiàng)。
無論是從企業(yè)存儲(chǔ)策略與環(huán)境來看,還是從數(shù)據(jù)與存儲(chǔ)操作的角度來看,大數(shù)據(jù)帶來的“管理風(fēng)險(xiǎn)”不僅日益突出,而且如果不能妥善解決,將肯定會(huì)造成“大數(shù)據(jù)就是大風(fēng)險(xiǎn)”的可怕后果。
Gartner:大數(shù)據(jù)到底有哪些挑戰(zhàn)與風(fēng)險(xiǎn)?
全球技術(shù)研究和咨詢公司Gartner指出,CIO通過排斥信息管理的其它方面而側(cè)重在信息的大容量上來管理“大數(shù)據(jù)”挑戰(zhàn),但這留下大量的挑戰(zhàn)需要在以后解決。當(dāng)信息管理人員同時(shí)失去數(shù)據(jù)訪問和資格方面的控制時(shí),他們可能將側(cè)重點(diǎn)放在量上。Gartner分析師告誡,過于狹窄的側(cè)重點(diǎn)將迫使兩到三年后進(jìn)行大規(guī)模的再投資,以解決大數(shù)據(jù)的其它方面的問題。
Gartner研究副總裁Mark Beyer表示:“當(dāng)今的信息管理準(zhǔn)則和技術(shù)根本無法完成處理所有動(dòng)態(tài)信息的任務(wù)。信息管理人員必須通過規(guī)劃信息管理的所有層面,從根本上重新考慮他們的方法。訪問大數(shù)據(jù)浩瀚資源的業(yè)務(wù)需求為信息管理人員提供了企業(yè)改變使用信息方式的機(jī)會(huì)。IT領(lǐng)袖一定要教育業(yè)務(wù)同行直面挑戰(zhàn),同時(shí)確保一定程度的控制和協(xié)調(diào),以使大數(shù)據(jù)機(jī)會(huì)不會(huì)變成大數(shù)據(jù)混亂, 這也許會(huì)提高合規(guī)分險(xiǎn),增加成本并創(chuàng)建了許多信息孤島。”
正如上文所述,分析師認(rèn)為,量只是大數(shù)據(jù)挑戰(zhàn)與風(fēng)險(xiǎn)中最直接和最常見的問題,CIO在將大量的交易信息轉(zhuǎn)化為決策上一直存在困擾 — 現(xiàn)在有更多類型的信息需要分析 — 主要來自社交媒體和移動(dòng)(情景感知)。種類包括表格數(shù)據(jù)(數(shù)據(jù)庫)、分層數(shù)據(jù)、文件、電子郵件、計(jì)量數(shù)據(jù)、視頻、靜態(tài)圖像、音頻、股票行情數(shù)據(jù)、金融交易和其它更多種類。而速度則涉及到數(shù)據(jù)流、結(jié)構(gòu)化記錄的創(chuàng)建,以及訪問和交付的可用性。速度意味著正在被生成的數(shù)據(jù)有多快和數(shù)據(jù)必須被多快地處理以滿足需求。
此外,在數(shù)據(jù)泄露、丟失和黑客活動(dòng)日益增長的今天,更好的數(shù)據(jù)保護(hù)和數(shù)據(jù)防泄漏都是企業(yè)CIO需要關(guān)注的問題。就像某汽車行業(yè)CIO向DOIT記者曾經(jīng)說過的,以前全備份一晚上干4個(gè)小時(shí),現(xiàn)在全備份4個(gè)晚上干完1次算不錯(cuò),在大量的汽車先進(jìn)設(shè)計(jì)手段的刺激下,汽車行業(yè)的非結(jié)構(gòu)化數(shù)據(jù)的壓力“暴增”,遠(yuǎn)遠(yuǎn)超過原有信息系統(tǒng)的承載能力。
但所有這些內(nèi)容都需要備份或留檔,因?yàn)檫@些都是非常重要的汽車設(shè)計(jì)資料。極大的風(fēng)險(xiǎn)擺在這位CIO的面前:備份窗口原來越長、重復(fù)數(shù)據(jù)刪除技術(shù)并不是每一個(gè)都對非結(jié)構(gòu)化數(shù)據(jù)有效、非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)在存儲(chǔ)系統(tǒng)中處于互相割裂、孤島式的管理與存儲(chǔ)方式的支撐下。所以這位CIO對分層技術(shù)、重復(fù)數(shù)據(jù)刪除、固態(tài)硬盤、統(tǒng)一存儲(chǔ)甚至是云存儲(chǔ)都非常感興趣,“這也是被逼無奈”。