大數(shù)據(jù)時代已經(jīng)到來,如何處理和利用龐大的信息,是眾多企業(yè)所面臨的新問題。
現(xiàn)在,眾多的社會活動及企業(yè)活動都離不開IT,而在這些活動中必然產(chǎn)生龐大的信息。隨著移動寬帶和移動通信產(chǎn)品的日益普及,更加速了這一趨勢。“信息爆炸”要求企業(yè)系統(tǒng)能夠正確分析和處理大量而復(fù)雜的信息數(shù)據(jù),但是,依靠以往的技術(shù)則很難做到。
只有能解決大數(shù)據(jù)問題的企業(yè),才能從商務(wù)變革中獲得商機。
要知道,大數(shù)據(jù)的種類多種多樣,比如,在進行金融交易、購買、服務(wù)活動時,在記錄器上以及產(chǎn)品制造過程中都會產(chǎn)生數(shù)據(jù);如果能夠快速處理這些數(shù)據(jù),不僅現(xiàn)有的產(chǎn)品及服務(wù)的效率得到提高,而且以往的人工業(yè)務(wù)也通過計算機自動化,得以改善或提供嶄新的服務(wù)。這樣一來,不同的商務(wù)領(lǐng)域,都將發(fā)現(xiàn)新的商機。
處理大數(shù)據(jù)的系統(tǒng)要做到:
- 處理龐大的數(shù)據(jù);
- 快速處理數(shù)據(jù);
- 根據(jù)數(shù)據(jù)規(guī)模,靈活擴展;
- 滿足費用的合理。
只有同時滿足以上4個條件,企業(yè)才能從大數(shù)據(jù)中獲得商業(yè)利益。以往的技術(shù)能處理數(shù)百GB的數(shù)據(jù),但是處理百萬億兆規(guī)模的數(shù)據(jù)時,就會遇到諸如無法應(yīng)對、處理能力不足、無法靈活擴展以及耗費成本等問題。
從技術(shù)層面,在滿足商業(yè)利益的前提下,能夠解決上述問題的關(guān)鍵是內(nèi)存即采取利用RAM(隨機存取存蓄器)處理數(shù)據(jù)的方法。在以往的硬盤驅(qū)動器上,無法滿足現(xiàn)有的性能要求。即使是速度更快的固態(tài)硬盤(SSD)和閃存也是遠(yuǎn)遠(yuǎn)不夠的??梢岳帽菻DD性價比更高的RAM。RAM具有HDD、SSD和閃存無法比擬的性能。
而且,軟件方面Java是解決很多問題的關(guān)鍵。Java具有垃圾回收(GC)這一優(yōu)良的數(shù)據(jù)管理功能,即當(dāng)需要分配的內(nèi)存空間不再使用時,JVM將調(diào)用垃圾回收機制來回收內(nèi)存空間,從而大大提高內(nèi)存的利用效率。但是GC也有它的問題,就是當(dāng)通過GC內(nèi)存得以釋放時,應(yīng)用軟件也會停止。
雖然隨著64(bit)中央處理器的普及,相當(dāng)容量的內(nèi)存是能夠分配的,但是內(nèi)存量越大,因GC而引起的軟件停止時間也就越長。對于要求具備更高性能的系統(tǒng)而言,這是致命的弱點。處理大數(shù)據(jù)的系統(tǒng)必須解決這個問題。
Terracotta已成功地開發(fā)出能夠快速處理大數(shù)據(jù)的技術(shù)。在利用Java應(yīng)用軟件的同時,包括財富2000在內(nèi)的50萬以上的商業(yè)用戶采用了大數(shù)據(jù)解決方案,并取得很大的成效。
Terracotta提供的解決方案中,核心產(chǎn)品有兩個。一是Enterprise Ehcache(緩存),它是通過Java商務(wù)系統(tǒng),把大量的數(shù)據(jù)存儲在外部高速緩沖存儲器內(nèi),以提高應(yīng)用軟件的性能。二是BigMemory,它支持進程內(nèi)的堆外緩存,可用來存儲應(yīng)用相關(guān)的大批量數(shù)據(jù)。
通過這兩項產(chǎn)品實現(xiàn)的內(nèi)存數(shù)據(jù)管理環(huán)境,并不依賴于特定的操作系統(tǒng)和Java環(huán)境以及數(shù)據(jù)庫。當(dāng)把這兩個產(chǎn)品安裝于軟件服務(wù)器和數(shù)據(jù)存儲區(qū)之間時,后部的各種數(shù)據(jù)庫數(shù)據(jù)庫就變成一個抽象化的巨大數(shù)據(jù)庫,能快速處理數(shù)據(jù)庫里的數(shù)據(jù)和文件。
安裝于Java記憶領(lǐng)域外部時,GC(垃圾回收機制即自動內(nèi)存)的前述的問題也就迎刃而解了。
與此同時,此項數(shù)據(jù)管理環(huán)境,是在產(chǎn)品服務(wù)器上運行,通過增加服務(wù)器,使數(shù)據(jù)放置區(qū)域Scale Up。經(jīng)過這個方法,上述4個問題可以同時得到解決。
Terracotta客戶中,比如VISA和提供在線支付服務(wù)的PayPal,為了解決因信用卡和在線結(jié)算而產(chǎn)生的不正行為問題,就利用了Terracotta的大數(shù)據(jù)解決方案。
在檢查不正行為時,需要對龐大的數(shù)據(jù)進行高速的分析處理。以往雖然使用高價的硬件和數(shù)據(jù)庫,但其效果卻不盡人意。各公司在利用Terracotta大數(shù)據(jù)解決方案后,成功地創(chuàng)造了及時分析數(shù)TB數(shù)據(jù)的環(huán)境。
VISA過去處理1件不正行為,通常需要花費十幾分鐘,而利用我們的大數(shù)據(jù)解決方案后,所需時間縮短到僅僅幾秒鐘。
除此而外,澳大利亞最大的通訊公司Telstra 就用CRM(客戶關(guān)系管理系統(tǒng)),管理絕大部分的顧客信息。運用大型電腦和開放環(huán)境的RDB(關(guān)系數(shù)據(jù)庫)處理CRM時,因為需要參照數(shù)據(jù)庫內(nèi)的客戶信息,所以處理一件平均要花費30秒。由于公司和顧客之間的95%的點擊來自客服中心,公司在運營客服中心上每年都要投入10億美元。公司曾經(jīng)考慮將客服中心轉(zhuǎn)到網(wǎng)站上,但因參照顧客信息還是要花費30秒而不得不放棄。
在此情況下,該公司就啟動了Terracotta大數(shù)據(jù)解決方案,采取了將數(shù)據(jù)庫中的顧客數(shù)據(jù)內(nèi)存后再加以處理的方式。通過這種方式,成功地把參照處理所需時間縮短到30毫秒。預(yù)計,幾年后公司顧客信息的規(guī)模將從目前的10TB,增加到100TB。
這樣,TelstraCRM系統(tǒng)的速度得以提高后,在成功地降低成本的同時,服務(wù)也得到提高。公司認(rèn)為,利用Terracotta大數(shù)據(jù)解決方案將會解決解約問題,并通過實施交叉銷售,大幅度提高銷售額。
由此可見,該公司的內(nèi)存數(shù)據(jù)庫管理的解決方案,不僅可以解決以往的問題,還可以成為推動商務(wù)變革的巨大動力。
本文作者是美國Terracotta公司總經(jīng)理,他是商務(wù)軟件方面的專家,有著20年以上的工作經(jīng)驗。在他的領(lǐng)導(dǎo)下,Terracotta在處理大數(shù)據(jù)方面成效顯著。目前,Terracotta為世界眾多由于“信息爆炸”而面臨商務(wù)變革的企業(yè)提供解決了方案。