某天SSL介紹了一個(gè)叫做GoodData的系統(tǒng),是一個(gè)據(jù)說(shuō)BI Platform as a Service的物件。一年前曾經(jīng)粗略地分析過(guò)哪些服務(wù)沒(méi)法當(dāng)做公有服務(wù)(XaaS的背后:哪些IT能力適合作為集中的云計(jì)算服務(wù)),這種分析類服務(wù)就是其中之一。主要原因包括:
(1)資源難以隔離,尤其是IO資源。
(2)多數(shù)用戶希望盡快獲得結(jié)果,而分析計(jì)算無(wú)法提供快速響應(yīng),在滿意度方面存在問(wèn)題
(3)投入較大,需要說(shuō)服用戶其計(jì)算式需要花費(fèi)大量成本
因此看到這個(gè)GoodData服務(wù)就對(duì)其抱有疑慮,也非常希望了解其架構(gòu)。不過(guò)GoodData對(duì)其技術(shù)保密程度較高,網(wǎng)站上沒(méi)有詳細(xì)介紹其技術(shù)。零零星星地透露了部分內(nèi)容。此系統(tǒng)主要面向時(shí)間序列數(shù)據(jù)的存儲(chǔ)和分析,通過(guò)流式計(jì)算將數(shù)據(jù)按照既定的模式完成預(yù)處理,形成可以支持OLAP查詢的系統(tǒng),由于OLAP是預(yù)先計(jì)算好的數(shù)據(jù),因此提供較為固定的資源就可以滿足需求。但是OLAP的靈活性較DW差,根據(jù)說(shuō)明GoodData一般用于特定的行業(yè)中特定計(jì)算。由此分析很可能在GoodData的系統(tǒng)中存在一種類似虛擬機(jī)的平臺(tái),提供了單實(shí)例的多租戶彈性的計(jì)算和存儲(chǔ)能力。每個(gè)用戶的數(shù)據(jù)分布在特定節(jié)點(diǎn)上,彼此不會(huì)互相干擾,但是很容易從資源池中獲取資源。下圖顯示了這種層次關(guān)系。
可以看到這個(gè)系統(tǒng)具有如下特征:
(1) 沒(méi)有采用數(shù)據(jù)庫(kù)
(2) 大量的預(yù)處理
(3) 提供預(yù)先定義的指標(biāo)供選用并定義新指標(biāo)(針對(duì)特定的領(lǐng)域)
(4) 內(nèi)存分析
(5) 結(jié)果集緩存
(6) 靈活的數(shù)據(jù)模型,可以不破壞原有的數(shù)據(jù)模型而變化
GoodData并不是唯一的此類系統(tǒng),還有一個(gè)LucidEra也是這樣的物件,wikipedia上提供了部分分析很有意思,推測(cè)LucidEra系統(tǒng)是由一些開(kāi)源軟件和一些自有軟件構(gòu)成的:
(1)前端系統(tǒng):JBoss、DOJO Tookit
(2)數(shù)據(jù)倉(cāng)庫(kù)&ETL:LucidDB
(3)OLAP:Pentaho Mondrian
從LucidEra身上不難猜測(cè)出GoodData的大體架構(gòu)。
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):