大數(shù)據(jù)擁有巨大的發(fā)展空間,從各國政府對大數(shù)據(jù)的政策中可見一斑。美國總統(tǒng)奧巴馬推出的大數(shù)據(jù)發(fā)展計劃,集合全美最頂尖的專家,將數(shù)據(jù)轉(zhuǎn)變成商業(yè)資產(chǎn)和價值。中國的大數(shù)據(jù)市場同樣毋庸置疑,大數(shù)據(jù)蘊藏著巨大的潛力和商機。近幾年,IT廠商紛紛推出各自的大數(shù)據(jù)戰(zhàn)略,EMC也不例外。
EMC作為一家傳統(tǒng)的存儲廠商,在全球存儲領域一直處于領導者的地位。近日,IT168記者對EMC數(shù)據(jù)計算產(chǎn)品部大中華區(qū)總經(jīng)理劉偉光先生進行了專訪,共同探討了大數(shù)據(jù)商業(yè)價值和大數(shù)據(jù)市場空間等一系列話題,并深入分析了EMC Greenplum的大數(shù)據(jù)戰(zhàn)略。
據(jù)劉偉光介紹,他于2011年11月加入EMC公司,負責數(shù)據(jù)計算事業(yè)部大中國區(qū)整體的運營。此前曾在Oracle工作將近八年的時間,從系統(tǒng)架構(gòu)師開始起步,后來做到大中國區(qū)企業(yè)架構(gòu)團隊的高級經(jīng)理,2010年成為Exadata大中國區(qū)產(chǎn)品事業(yè)部的總監(jiān)。劉偉光所在的EMC數(shù)據(jù)計算產(chǎn)品部門前身是EMC收購的Greenplum公司。Greenplum是分布式數(shù)據(jù)庫的全球領導者,EMC看重它未來的商業(yè)價值,尤其在大數(shù)據(jù)市場的巨大潛力,因此收購Greenplum公司。在全球成立獨立運作的事業(yè)部,即數(shù)據(jù)計算事業(yè)部。劉偉光作為這個事業(yè)部大中國區(qū)的經(jīng)理,主要負責這個產(chǎn)品的在中國整體的業(yè)務推廣,包括銷售、售前、服務、品牌推廣等一系列工作。
數(shù)據(jù)庫發(fā)展的三個里程碑
談到數(shù)據(jù)庫應用的發(fā)展進程,劉偉光表示,回溯中國大型企業(yè)IT建設經(jīng)歷過的十五年,大致有三個里程碑:第一個里程碑是面向交易型的關(guān)系型數(shù)據(jù)庫,90年代末到2000年初是中國IT系統(tǒng)建設發(fā)展最快、建設力度最廣、投資最大的幾年。中國IT建設從一個相對落后的階段,走向一個新的發(fā)展歷程,越來越多的國外企業(yè)進入中國。中國IT系統(tǒng)建設,尤其在電信、銀行和政府領域經(jīng)歷了一場大規(guī)模的變革。傳統(tǒng)數(shù)據(jù)庫一般來講都是OLTP,即面向事務處理和交易的數(shù)據(jù)庫,通常是支持系統(tǒng)的基本業(yè)務功能操作和企業(yè)最基本的信息化需求,電信行業(yè)建設計費系統(tǒng)、CRM系統(tǒng)、客服系統(tǒng),銀行行業(yè)建設前臺核心系統(tǒng),其他行業(yè)建設基本的客戶管理、營銷系統(tǒng)。這種系統(tǒng)的主要功能是存儲數(shù)據(jù),面向客戶提供一些服務,就如同解決人們生活的溫飽問題,這種數(shù)據(jù)庫就是支持聯(lián)機事務處理型的數(shù)據(jù)庫。
第二個里程碑是數(shù)據(jù)倉庫,也可以比喻成IT建設解決溫飽問題之后更高層次的需求。在這個階段,企業(yè)的IT運營達到一定的水平,積累了很多經(jīng)驗。企業(yè)發(fā)現(xiàn)數(shù)據(jù)是非常重要的資產(chǎn),但是并沒有將常年積累的數(shù)據(jù)變成指導企業(yè)運營的技術(shù)基礎。在這個階段,很多大型企業(yè)開始建設數(shù)據(jù)倉庫。數(shù)據(jù)倉庫的前身是分析報表系統(tǒng),即把數(shù)據(jù)從數(shù)據(jù)庫中抽取出來形成統(tǒng)計報表,但這個報表通常不會對企業(yè)運營和決策分析做指導。到了數(shù)據(jù)倉庫的階段,數(shù)據(jù)不僅形成報表,還要根據(jù)各種主題、企業(yè)內(nèi)部需求進行加工、分析,進而形成決策支撐的數(shù)據(jù)來源。經(jīng)過存儲數(shù)據(jù)、挖掘數(shù)據(jù)、加工數(shù)據(jù)、展現(xiàn)數(shù)據(jù)的過程,數(shù)據(jù)產(chǎn)生的結(jié)果成為企業(yè)下一步運營和制定市場策略最重要的技術(shù)輸入。
第三個里程碑是大數(shù)據(jù)。最近幾年云計算如火如荼,云計算和大數(shù)據(jù)在很多層面都是相輔相成的關(guān)系。在這個階段,隨著新技術(shù)的沖擊和技術(shù)手段的推陳出新,以及互聯(lián)網(wǎng)技術(shù)對IT行業(yè)發(fā)展的影響日益顯現(xiàn)。云計算的出現(xiàn)對數(shù)據(jù)倉庫產(chǎn)生巨大的挑戰(zhàn),如何處理傳統(tǒng)關(guān)系型數(shù)據(jù)庫不能處理的數(shù)據(jù),是新技術(shù)面臨的最大挑戰(zhàn)。海量數(shù)據(jù)與大數(shù)據(jù)是不同概念,海量數(shù)據(jù)通常指的是在按照數(shù)據(jù)庫表結(jié)構(gòu)設計處理之后,存儲到傳統(tǒng)的關(guān)系型數(shù)據(jù)庫當中的數(shù)據(jù)集合。大數(shù)據(jù)在數(shù)據(jù)容量上也比海量數(shù)據(jù)更大。另外,大數(shù)據(jù)的數(shù)據(jù)來源非常豐富,數(shù)據(jù)類型更為繁多,其中包括來自互聯(lián)網(wǎng)和傳統(tǒng)企業(yè)的高度信息化后產(chǎn)生的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),以及不斷產(chǎn)生的歷史歸檔數(shù)據(jù),這些數(shù)據(jù)遠遠不是現(xiàn)在的技術(shù)能夠快速加載的,而且也不是傳統(tǒng)的數(shù)據(jù)庫和數(shù)據(jù)倉庫所能存儲管理和分析的。
大數(shù)據(jù)蘊藏商業(yè)價值
現(xiàn)在很多公司都在談論大數(shù)據(jù),專家對大數(shù)據(jù)都有著各自的看法,劉偉光認為大數(shù)據(jù)主要包括四個特征:第一,大數(shù)據(jù)的數(shù)據(jù)量非常大;第二,大數(shù)據(jù)有非常復雜的數(shù)據(jù)來源;第三,大數(shù)據(jù)有非常復雜的數(shù)據(jù)結(jié)構(gòu),并不是傳統(tǒng)關(guān)系型數(shù)據(jù)庫能夠處理的數(shù)據(jù)集合;第四,大數(shù)據(jù)的實效比很低,即在單位時間內(nèi)處理數(shù)據(jù)的價值是相對較低,但如果能達到快速處理和分析單位時間內(nèi)的大數(shù)據(jù),就將產(chǎn)生無法預期的商業(yè)價值。