現(xiàn)今我們已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,因?yàn)閯?chuàng)新的數(shù)據(jù)管理技術(shù)的誕生,使得組織可以對(duì)所有的數(shù)據(jù)類(lèi)型進(jìn)行分析。這也使得企業(yè)每天都能夠發(fā)掘出新的商業(yè)機(jī)會(huì)。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,當(dāng)今網(wǎng)絡(luò)中每天都在產(chǎn)生海量的信息,這其中包括半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。組織可以通過(guò)對(duì)海量信息的分析了解到他們客戶真正需要的以及為什么需要的原因。但新的商業(yè)模式的真實(shí)成本還尚未被人們充分認(rèn)識(shí)。
數(shù)據(jù)格式的多樣化
從IT角度來(lái)看,信息結(jié)構(gòu)類(lèi)型大致經(jīng)歷了三次浪潮。必須注意這一點(diǎn),新的浪潮并沒(méi)取代舊浪潮,它們?nèi)栽诓粩喟l(fā)展,三種數(shù)據(jù)結(jié)構(gòu)類(lèi)型一直存在,只是其中一種結(jié)構(gòu)類(lèi)型往往主導(dǎo)于其他結(jié)構(gòu):
結(jié)構(gòu)化信息——這種信息可以在關(guān)系數(shù)據(jù)庫(kù)中找到,多年來(lái)一直主導(dǎo)著IT應(yīng)用。這是關(guān)鍵任務(wù)OLTP系統(tǒng)業(yè)務(wù)所依賴(lài)的信息,另外,還可對(duì)結(jié)構(gòu)數(shù)據(jù)庫(kù)信息進(jìn)行排序和查詢;
半結(jié)構(gòu)化信息——這是IT的第二次浪潮,包括電子郵件,文字處理文件以及大量保存和發(fā)布在網(wǎng)絡(luò)上的信息。半結(jié)構(gòu)化信息是以內(nèi)容為基礎(chǔ),可以用于搜索,這也是谷歌存在的理由;
非結(jié)構(gòu)化信息——該信息在本質(zhì)形式上可認(rèn)為主要是位映射數(shù)據(jù)。數(shù)據(jù)必須處于一種可感知的形式中(諸如可在音頻、視頻和多媒體文件中被聽(tīng)或被看)。許多大數(shù)據(jù)都是非結(jié)構(gòu)化的,其龐大規(guī)模和復(fù)雜性需要高級(jí)分析工具來(lái)創(chuàng)建或利用一種更易于人們感知和交互的結(jié)構(gòu)。
市場(chǎng)的領(lǐng)導(dǎo)者們對(duì)存儲(chǔ)的多格式數(shù)據(jù)進(jìn)行分析不止獲得競(jìng)爭(zhēng)的優(yōu)勢(shì)。通過(guò)對(duì)數(shù)據(jù)的分析使得他們可以更深入的洞察客戶的行為模式,這直接影響到他們的業(yè)務(wù)。
兩個(gè)特定的行業(yè)——電信和零售已經(jīng)在數(shù)據(jù)倉(cāng)庫(kù)解決方案投入巨資。隨著時(shí)間的推移,電信和零售兩大行業(yè)通過(guò)對(duì)累積的大量客戶事務(wù)和互動(dòng)數(shù)據(jù)研究以確定關(guān)鍵的性能指標(biāo)。例如每年的收入、每個(gè)客戶通過(guò)網(wǎng)絡(luò)獲取促銷(xiāo)信息所導(dǎo)致花費(fèi)以及銷(xiāo)售的高峰。
然而隨著數(shù)據(jù)的激增,即使是市場(chǎng)的領(lǐng)導(dǎo)者也無(wú)法承受,傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)已無(wú)法存儲(chǔ)和管理PB級(jí)規(guī)模的原始詳細(xì)數(shù)據(jù)。企業(yè)往往將數(shù)據(jù)備份到離線的磁帶上,但這并不容易訪問(wèn)。業(yè)務(wù)的挑戰(zhàn)無(wú)處不在,例如當(dāng)圣誕節(jié)恰逢星期六時(shí),企業(yè)就需要對(duì)7年前(恰逢圣誕節(jié)也是周六)的數(shù)據(jù)進(jìn)行分析以便了解特定的模式。將大量的歷史數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)不僅極具挑戰(zhàn)性,同時(shí)成本也是非常昂貴的。