
以上我們討論的架構(gòu)組建,都能與mapr 融合數(shù)據(jù)平臺(tái)在同一數(shù)據(jù)集群上運(yùn)行。當(dāng)然,整合Hadoop、Spark、實(shí)時(shí)數(shù)據(jù)庫(kù)、全球性事件流及大規(guī)模企業(yè)級(jí)存儲(chǔ),還會(huì)帶來(lái)以下好處:
▪ 維護(hù)一個(gè)數(shù)據(jù)集群,意味著更少的系統(tǒng)架構(gòu)部署和管理,對(duì)系統(tǒng)安全、穩(wěn)定性和性能方面的監(jiān)控也減少了。這樣極大程度上降低了硬件和運(yùn)營(yíng)成本。
▪ 生產(chǎn)者和消費(fèi)者在同一集群,將會(huì)降低因在不同集群和應(yīng)用程序間復(fù)制或移動(dòng)數(shù)據(jù)而造成的延遲。

案例架構(gòu)
Valence Health使用MapR融合數(shù)據(jù)平臺(tái)來(lái)創(chuàng)建作為該公司主要數(shù)據(jù)儲(chǔ)存地的數(shù)據(jù)湖。該公司產(chǎn)生3000條內(nèi)部數(shù)據(jù)記錄,涵蓋45種不同類型,包括實(shí)驗(yàn)室測(cè)試數(shù)據(jù)、病人生命體征、處方、藥品津貼、索賠和支出等,其中索賠來(lái)自醫(yī)生和醫(yī)院兩方面。在過去,如果我們要從2000萬(wàn)條實(shí)驗(yàn)室記錄中檢索一條記錄,將花費(fèi)22個(gè)小時(shí)。而MapR只需要20分鐘,并且其所消耗的硬件資源還會(huì)大大減少。

國(guó)立衛(wèi)生研究院為了整合各研究院的數(shù)據(jù)集,也創(chuàng)建了一個(gè)數(shù)據(jù)湖。這樣,所有的數(shù)據(jù)都集中在一個(gè)地方,更加方便數(shù)據(jù)共享和處理。
UnitedHealthcare IT部門采用Hadoop框架創(chuàng)建了一個(gè)平臺(tái)。該平臺(tái)上有各種工具,能夠
分析諸如索賠、處方、治療計(jì)劃參與者、合同服務(wù)提供者及相關(guān)的索賠審議結(jié)果等信息。