數(shù)據(jù)分級(jí)和設(shè)置主鍵
分級(jí)大數(shù)據(jù)需要額外的硬件,軟件,存儲(chǔ)媒介。存儲(chǔ)前為了執(zhí)行任何轉(zhuǎn)換或清潔,作為臨時(shí)區(qū)域分級(jí)是必要的。此外, 數(shù)據(jù)倉(cāng)庫(kù), 現(xiàn)在加上大數(shù)據(jù), 隨著時(shí)間而積累數(shù)據(jù)。這樣的數(shù)據(jù)必然是由日期或時(shí)間為主鍵。人們也普遍在數(shù)據(jù)倉(cāng)庫(kù)獲取業(yè)務(wù)數(shù)據(jù), 并將它按日期分區(qū)存儲(chǔ)在DB2表中。如果這些表中的數(shù)據(jù)以日期為主鍵,這些主鍵也必須被添加到大數(shù)據(jù)。
另一個(gè)問(wèn)題是純粹的數(shù)據(jù)量。為了幫助解決這一問(wèn)題,多數(shù)大型數(shù)據(jù)分析解決方案都包括某種形式的數(shù)據(jù)壓縮的或?qū)S械臄?shù)據(jù)存儲(chǔ)機(jī)制。
數(shù)據(jù)訪(fǎng)問(wèn)和分析
最后我們將數(shù)據(jù)整合到數(shù)據(jù)倉(cāng)庫(kù)。此時(shí),用戶(hù)可以對(duì)合并后的大數(shù)據(jù)和當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)執(zhí)行分析軟件。這就是你最后感覺(jué)該實(shí)施是否值得投資的時(shí)候。
數(shù)據(jù)歸檔
最后我們考慮數(shù)據(jù)檔案。隨著大量的數(shù)據(jù)被分析,龐大數(shù)據(jù)量可能會(huì)占用寶貴的存儲(chǔ)媒體并讓一些流程運(yùn)行緩慢。IT和業(yè)務(wù)合作伙伴必須決定舊的或失效的大數(shù)據(jù)如何以及何時(shí)需要?dú)w檔,以及是否必須保留下來(lái)供以后使用。這是另一個(gè)要考慮的成本因素。
總結(jié)
分析大數(shù)據(jù)增加業(yè)務(wù)價(jià)值的概念聽(tīng)起來(lái)美妙。然而, 實(shí)現(xiàn)過(guò)程中有幾個(gè)步驟,他們會(huì)影響企業(yè)數(shù)據(jù)倉(cāng)庫(kù)流程的方方面面。看看你的整個(gè)的企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)流程、硬件和軟件來(lái)確定您的實(shí)施將影響的每一個(gè)區(qū)域。只有這樣,你才能準(zhǔn)備好過(guò)渡到大數(shù)據(jù)。
還想了解更多的BI商業(yè)智能軟件知識(shí)?那就快快加入我們的“綠色BI社區(qū)”,與我們共同學(xué)習(xí)成長(zhǎng)!
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):