大數(shù)據(jù)是由三項(xiàng)主要技術(shù)趨勢(shì)匯聚組成:
海量交易數(shù)據(jù):在從 ERP應(yīng)用程序到數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用程序的在線交易處理(OLTP)與分析系統(tǒng)中,傳統(tǒng)的關(guān)系數(shù)據(jù)以及非結(jié)構(gòu)化和半結(jié)構(gòu)化信息仍在繼續(xù)增長(zhǎng)。隨著企業(yè)將更多的數(shù)據(jù)和業(yè)務(wù)流程移向公共和私有云,這一局面變得更加復(fù)雜。
海量交互數(shù)據(jù):這一新生力量由源于 Facebook、Twitter、LinkedIn 及其它來(lái)源的社交媒體數(shù)據(jù)構(gòu)成。它包括了呼叫詳細(xì)記錄(CDR)、設(shè)備和傳感器信息、GPS 和地理定位映射數(shù)據(jù)、通過(guò)管理文件傳輸(Manage File Transfer)協(xié)議傳送的海量圖像文件、Web 文本和點(diǎn)擊流數(shù)據(jù)、科學(xué)信息、電子郵件等等。
海量數(shù)據(jù)處理:大數(shù)據(jù)的涌現(xiàn)已經(jīng)催生出了設(shè)計(jì)用于數(shù)據(jù)密集型處理的架構(gòu),例如具有開(kāi)放源碼、在商品硬件群中運(yùn)行的 Apache Hadoop。對(duì)于企業(yè)來(lái)說(shuō),難題在于以具備成本效益的方式快速可靠地從 Hadoop 中存取數(shù)據(jù)。
定義二:大數(shù)據(jù)包括A、B、C三個(gè)要素
如何理解大數(shù)據(jù)?NetApp 大中華區(qū)總經(jīng)理陳文認(rèn)為,大數(shù)據(jù)意味著通過(guò)更快獲取信息來(lái)使做事情的方式變得與眾不同,并因此實(shí)現(xiàn)突破。大數(shù)據(jù)被定義為大量數(shù)據(jù)(通常是非結(jié)構(gòu)化的),它要求我們重新思考如何存儲(chǔ)、管理和恢復(fù)數(shù)據(jù)。那么,多大才算大呢?考慮這個(gè)問(wèn)題的一種方式就是,它是如此之大,以至于我們今天所使用的任何工具都無(wú)法處理它,因此,如何消化數(shù)據(jù)并把它轉(zhuǎn)化成有價(jià)值的洞見(jiàn)和信息,這其中的關(guān)鍵就是轉(zhuǎn)變。
基于從客戶那里了解的工作負(fù)載要求, NetApp所理解的大數(shù)據(jù)包括A、B、C三個(gè)要素:分析(Analytic),帶寬(Bandwidth)和內(nèi)容(Content)。
1. 大分析(Big Analytics),幫助獲得洞見(jiàn) - 指的是對(duì)巨大數(shù)據(jù)集進(jìn)行實(shí)時(shí)分析的要求,它能帶來(lái)新的業(yè)務(wù)模式,更好的客戶服務(wù),并實(shí)現(xiàn)更好的結(jié)果。
2. 高帶寬(Big Bandwidth),幫助走得更快 - 指的是處理極端高速的關(guān)鍵數(shù)據(jù)的要求。它支持快速有效地消化和處理大型數(shù)據(jù)集。
3. 大內(nèi)容(Big Content),不丟失任何信息- 指的是對(duì)于安全性要求極高的高可擴(kuò)展的數(shù)據(jù)存儲(chǔ),并能夠輕松實(shí)現(xiàn)恢復(fù)。它支持可管理的信息內(nèi)容存儲(chǔ)庫(kù)、而不只是存放過(guò)久的數(shù)據(jù),并且能夠跨越不同的大陸板塊。
大數(shù)據(jù)是一股突破性的經(jīng)濟(jì)和技術(shù)力量,它為 IT 支持引入了新的基礎(chǔ)架構(gòu)。大數(shù)據(jù)解決方案消除了傳統(tǒng)的計(jì)算和存儲(chǔ)的局限。借助于不斷增長(zhǎng)的私密和公開(kāi)數(shù)據(jù),一種劃時(shí)代的新商業(yè)模式正在興起,它有望為大數(shù)據(jù)客戶帶來(lái)新的實(shí)質(zhì)性的收入增長(zhǎng)點(diǎn)以及富于競(jìng)爭(zhēng)力的優(yōu)勢(shì)。