數(shù)據(jù)分析技術(shù)與商業(yè)智能的發(fā)展使得CIO們能以較低成本、快速而深入地處理商業(yè)數(shù)據(jù)。
近期,趨勢(shì)中心調(diào)查顯示,CIO們對(duì)商業(yè)分析的關(guān)注度并不低于如何利用新商機(jī)的力度。例如,隨著越來越多公司不得不面對(duì)海量數(shù)據(jù),如何利用這些數(shù)據(jù)也被提上了日程。大型數(shù)據(jù)集管理與分析等技術(shù)的出現(xiàn),能夠提前幫助公司分析成本與發(fā)展趨勢(shì),提供更有用的信息以幫助公司運(yùn)營(yíng)業(yè)務(wù),這意味著公司能夠發(fā)現(xiàn)比以前更深層次的問題。
在采訪中,CIO們總結(jié)出了五點(diǎn)影響他們進(jìn)行商業(yè)分析的IT趨勢(shì),分別為:大數(shù)據(jù)增長(zhǎng)、數(shù)據(jù)快速處理技術(shù)、IT商品的成本下降、移動(dòng)設(shè)備的普及和社交媒體的增長(zhǎng)。
第一,大數(shù)據(jù)。
大數(shù)據(jù)指非常龐大的數(shù)據(jù)集,尤其是那些沒有被組織、管理起來,不適于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)集。比如:網(wǎng)絡(luò)蜘蛛數(shù)據(jù)、社交媒體反饋和服務(wù)器日志,以及來自供應(yīng)鏈、行業(yè)、周邊環(huán)境與監(jiān)視傳感器的數(shù)據(jù)等,這些數(shù)據(jù)致使公司的商業(yè)分析變得比以往更加復(fù)雜。
盡管并不是每個(gè)公司都需要處理大型、非結(jié)構(gòu)型的數(shù)據(jù)集。但是,Verisk Analytics公司CIO Perry Rotella認(rèn)為所有公司的CIO都應(yīng)當(dāng)關(guān)注大數(shù)據(jù)的分析工具。Verisk幫助金融公司評(píng)估風(fēng)險(xiǎn),與保險(xiǎn)公司共同防范保險(xiǎn)詐騙,2010年的營(yíng)收超過了10億美元。
Rotella的工作是預(yù)先尋找數(shù)據(jù)間的聯(lián)系與模型。他認(rèn)為,技術(shù)領(lǐng)導(dǎo)者對(duì)于數(shù)據(jù)大幅度的增長(zhǎng),應(yīng)該持樂觀、歡迎的態(tài)度。
HMS公司CIO Cynthia Nustad認(rèn)為,大數(shù)據(jù)呈現(xiàn)為一種“爆炸性”增長(zhǎng)趨勢(shì)。HMS公司的業(yè)務(wù)包括幫助聯(lián)邦醫(yī)療保險(xiǎn)(Medicare)和醫(yī)療補(bǔ)助(Medicaid)項(xiàng)目控制成本及私有云服務(wù)。其客戶包括40多個(gè)州的健康與服務(wù)項(xiàng)目和130多個(gè)醫(yī)療補(bǔ)助管理計(jì)劃。HMS通過阻止錯(cuò)誤支付在2010年幫助其客戶挽回了18億美元的損失,節(jié)約了數(shù)十億美元。Nustad稱:“我們正在收集并追蹤大量素材,包括結(jié)構(gòu)性與非結(jié)構(gòu)性數(shù)據(jù),因?yàn)槟悴⒉恢滥銓⒃谄渲袑ふ业绞裁础?rdquo;
關(guān)于大數(shù)據(jù)談?wù)撟疃嗟囊豁?xiàng)技術(shù)是Hadoop。該技術(shù)為開源分布式數(shù)據(jù)處理平臺(tái),最初是為網(wǎng)絡(luò)搜索索引等任務(wù)開發(fā)的。Hadoop為多個(gè)“非關(guān)系型(NoSQL)”技術(shù)(其包括CouchDB 和 MongoDB)中的一種,其通過特殊的方式組織網(wǎng)絡(luò)級(jí)數(shù)據(jù)。
Hadoop可將數(shù)據(jù)的子集合分配給成百上千臺(tái)服務(wù)器處理,而主作業(yè)調(diào)度程序?qū)⒄砻颗_(tái)服務(wù)器匯報(bào)的結(jié)果,因此其具有處理拍字節(jié)級(jí)數(shù)據(jù)的能力。Hadoop既能夠用于分析前的數(shù)據(jù)準(zhǔn)備,也能夠作為一種分析工具。此外,沒有數(shù)千臺(tái)空閑服務(wù)器的公司,也可以從亞馬遜等云廠商那里購(gòu)買Hadoop的按需服務(wù)。
Nustad稱,盡管并不是為了其大型的聯(lián)邦醫(yī)療保險(xiǎn)和醫(yī)療補(bǔ)助索賠建立的數(shù)據(jù)庫(kù),但是HMS正在探索NoSQL技術(shù)的使用。其包括結(jié)構(gòu)性數(shù)據(jù),并且能夠被傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)所處理。她稱,經(jīng)過實(shí)踐證明最好用的解決方案,如果從傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)管理層面出發(fā)并不明智。不過,Nustad認(rèn)為Hadoop在防止欺詐與浪費(fèi)分析上發(fā)揮著重要作用,并具備能夠分析各種格式的病歷方面的潛力。
在采訪中,那些體驗(yàn)過Hadoop的CIO們,包括Rotella和Shopzilla 公司CIO Jody Mulkey在內(nèi),都將數(shù)據(jù)服務(wù)作為公司業(yè)務(wù)的參考重點(diǎn)。
Mulkey稱:“我們正在使用Hadoop,代替以往數(shù)據(jù)倉(cāng)庫(kù)的工作。更重要的是,我們獲得了以前未有的切實(shí)有用的分析技術(shù)。”例如,作為一家商務(wù)網(wǎng)站,Shopzilla每天會(huì)積累大量的數(shù)據(jù)。他稱:“以前,我們必須要對(duì)數(shù)據(jù)進(jìn)行采樣并對(duì)數(shù)據(jù)進(jìn)行歸類。在處理海量數(shù)據(jù)時(shí),這一工作非常繁重。”自從采用了Hadoop,Shopzilla能夠分析原始數(shù)據(jù),跳過許多中間環(huán)節(jié)。
Good Samaritan醫(yī)院是一家位于印第安納州西南的社區(qū)醫(yī)院,其數(shù)據(jù)處于另一種類型。該醫(yī)院的CIO Chuck Christian稱:“我們并沒有我認(rèn)為屬于大數(shù)據(jù)的東西。”盡管如此,管理中規(guī)定要求其整合龐大的電子醫(yī)療記錄,存儲(chǔ)為全新的數(shù)據(jù)類型。他稱,這無疑要求他們實(shí)現(xiàn)從數(shù)據(jù)中收集醫(yī)療保健信息。不過,這可能將在地區(qū)或國(guó)家層次的醫(yī)療保健協(xié)會(huì)中實(shí)現(xiàn),而不是在他們這種單個(gè)醫(yī)院中實(shí)現(xiàn)。因此,Christian未必會(huì)對(duì)這種新技術(shù)進(jìn)行投資。
Island>