為什么大數(shù)據(jù)分析對(duì)企業(yè)很重要
主要的IT公司對(duì)分析軟件和應(yīng)用系統(tǒng)供應(yīng)商的購(gòu)買(mǎi)已經(jīng)成為一種日?,F(xiàn)象。我們已經(jīng)看到“大數(shù)據(jù)分析”這個(gè)詞匯被使用在許多企業(yè)的解決方案中。
“大數(shù)據(jù)”是用來(lái)表示大量的沒(méi)有按照傳統(tǒng)的相關(guān)格式存儲(chǔ)在企業(yè)數(shù)據(jù)庫(kù)中的非結(jié)構(gòu)化數(shù)據(jù)的總術(shù)語(yǔ)。以下是大數(shù)據(jù)的一般特點(diǎn)。
數(shù)據(jù)存儲(chǔ)量相對(duì)于當(dāng)前企業(yè)TB(TERA BYTES)字節(jié)的存儲(chǔ)限制,定義在PB(PETA BYTES)字節(jié),EXA字節(jié)以及更高的容量順序。
通常它被認(rèn)為是非結(jié)構(gòu)化數(shù)據(jù),并不適合企業(yè)已經(jīng)習(xí)慣使用的關(guān)系型數(shù)據(jù)庫(kù)之下
數(shù)據(jù)的生成使用的是數(shù)據(jù)輸入非傳統(tǒng)的手段,像無(wú)線射頻識(shí)別(RFID),傳感器網(wǎng)絡(luò)等。
數(shù)據(jù)對(duì)時(shí)間敏感,且由數(shù)據(jù)的收集與相關(guān)的時(shí)區(qū)組成。
在過(guò)去,專業(yè)術(shù)語(yǔ)“分析”應(yīng)用于商業(yè)智能(BI)世界來(lái)提供工具和智能,通過(guò)對(duì)各種各樣可能的信息視角的快速的、一致的、交互式訪問(wèn)獲得洞察力。
與分析的概念非常接近,數(shù)據(jù)挖掘已經(jīng)應(yīng)用于企業(yè)以保持關(guān)鍵監(jiān)測(cè)和海量信息的分析。最大的挑戰(zhàn)就是如何通過(guò)大量的數(shù)據(jù)挖掘出所有的隱藏信息。
傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)(DW)分析相對(duì)于大數(shù)據(jù)分析

企業(yè)數(shù)據(jù)的分析朝著在一段時(shí)間內(nèi)在那種內(nèi)容中的信息的有意義的洞察,是大數(shù)據(jù)分析區(qū)別于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)分析的原因所在。下表總結(jié)了一些它們之間的差別。
大數(shù)據(jù)分析用例
基于用例,企業(yè)可以理解大數(shù)據(jù)分析的價(jià)值和在大數(shù)據(jù)分析的幫助下如何解決傳統(tǒng)的問(wèn)題。以下是一些用法。
客戶滿意度和保證分析:也許這是基于產(chǎn)品的企業(yè)所擔(dān)心的最大的一個(gè)領(lǐng)域。在當(dāng)今時(shí)代,沒(méi)有一個(gè)清晰的方式來(lái)衡量產(chǎn)品的問(wèn)題和與客戶滿意度相關(guān)的問(wèn)題,除非他們以一個(gè)正式的方式出現(xiàn)在一個(gè)電子表格中。
信息質(zhì)量方面,它是通過(guò)各種外部渠道收集的,而且大多數(shù)時(shí)候的數(shù)據(jù)沒(méi)有清洗。
因?yàn)閿?shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),無(wú)法關(guān)聯(lián)相關(guān)的問(wèn)題,所以長(zhǎng)期的解決方案提供給客戶。
分類和分組的問(wèn)題陳述都缺失了,導(dǎo)致企業(yè)不能對(duì)問(wèn)題進(jìn)行分組。
從上面的討論中,對(duì)客戶滿意度和保證分析使用大數(shù)據(jù)分析將幫助企業(yè)在急需的客戶注意力設(shè)置中獲得洞察力,并有效地解決他們的問(wèn)題以及在他們的新產(chǎn)品線上避免這些問(wèn)題。
競(jìng)爭(zhēng)對(duì)手的市場(chǎng)滲透率分析:在今天高度競(jìng)爭(zhēng)的經(jīng)濟(jì)環(huán)境下,我們需要通過(guò)一種實(shí)時(shí)分析對(duì)競(jìng)爭(zhēng)者強(qiáng)大的區(qū)域和他們的痛點(diǎn)進(jìn)行衡量。這種信息是可適用于各種各樣的網(wǎng)站、社交媒體網(wǎng)站和其他公共領(lǐng)域。對(duì)這種數(shù)據(jù)的大數(shù)據(jù)分析可以向企業(yè)提供關(guān)于他們產(chǎn)品線的優(yōu)勢(shì)、劣勢(shì)、機(jī)遇、威脅等非常需要的信息。
醫(yī)療保健/流行病的研究和控制:流行病和像流感這樣的季節(jié)性疾病在人群中以一定的模式開(kāi)始,如果沒(méi)有及早發(fā)現(xiàn)和控制,它們就會(huì)傳播到更大的區(qū)域。這對(duì)發(fā)展中以及發(fā)達(dá)的國(guó)家都是一個(gè)最大的挑戰(zhàn)。當(dāng)前絕大部分時(shí)間的問(wèn)題是人們之間的癥狀各異,而且不同的醫(yī)護(hù)人員治療他們的方法也不同。人群中也沒(méi)有一種常見(jiàn)的癥狀分類。在這種典型的非結(jié)構(gòu)化數(shù)據(jù)上采用大數(shù)據(jù)分析將有助于地方政府有效地應(yīng)對(duì)疫情的情況。
產(chǎn)品功能和用法分析:大多數(shù)產(chǎn)品企業(yè),尤其是消費(fèi)品,不斷在他們的產(chǎn)品線上增加許多功能,但有可能一些功能不會(huì)真正地被顧客所使用,而有些功能則更多地被使用,對(duì)這種通過(guò)各種移動(dòng)設(shè)備和其它基于無(wú)線射頻識(shí)別(RFID)輸入捕捉到的數(shù)據(jù)的有效分析,可以為產(chǎn)品企業(yè)提供有價(jià)值的洞察力。
未來(lái)方向的分析:研究小組分析在各種業(yè)務(wù)中的趨勢(shì),而這種信息通過(guò)行業(yè)特定門(mén)戶網(wǎng)站甚至常見(jiàn)的博客可以獲得。對(duì)這種未來(lái)數(shù)據(jù)的不斷分析將有助于企業(yè)期待未來(lái),并將這些期待帶入他們的生產(chǎn)線。
總結(jié)
大數(shù)據(jù)分析為企業(yè)和政府分析非結(jié)構(gòu)化的數(shù)據(jù)提供了新的途徑,這些非結(jié)構(gòu)化數(shù)據(jù)到目前為止在典型的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的情景中被數(shù)據(jù)清洗的慣例所拒絕。然而從以上用例明顯看出,這些分析在改善企業(yè)的運(yùn)營(yíng)方面有很長(zhǎng)的路要走。我們?cè)谖磥?lái)的日子里將會(huì)看到更多的產(chǎn)品和應(yīng)用系統(tǒng)在這個(gè)市場(chǎng)上出現(xiàn)。