那么Hadoop和數(shù)據(jù)倉庫是最終的BI夢想團隊嗎
哇哦,請等一下。使用Hadoop與數(shù)據(jù)倉庫處理了數(shù)據(jù)存儲問題。但是存儲數(shù)據(jù)只是商業(yè)智能的一個要素。
廣義上說,一個功能性的、可用的BI系統(tǒng)應該由五個部分組成:
在某個地方幾種存儲數(shù)據(jù)。
劃分這些數(shù)據(jù)的工具,如:地理,操作或者其他業(yè)務需要的工具。
為數(shù)據(jù)分析準備工具。
幫助您快速處理此數(shù)據(jù)的ETL數(shù)據(jù)引擎。
顯示所有這些數(shù)據(jù)的前端(通常是某種儀表盤)。
即使Hadoop和數(shù)據(jù)倉庫在最好的情況協(xié)同工作,他們也只處理這些組件中的第一個?,F(xiàn)在,BI技術的創(chuàng)新,同時提供了所有的五個組件,很快將夢想團隊降級為二類組合。
誰,誰會為了搶風頭而出風頭
正如我們看到的,數(shù)據(jù)倉庫和Hadoop是一個成功的雙重行為。但是,要執(zhí)行來自多個源的快速、高性能的數(shù)據(jù)分析,您并不需要它們中的任何一個。
現(xiàn)在,我們正在見證一顆新星的崛起。
整體的“單棧”解決方案消除了關系數(shù)據(jù)庫的需要,直接鏈接源數(shù)據(jù),無論來自何處,并在現(xiàn)場執(zhí)行英語教學功能。最好的工作是創(chuàng)建一個元數(shù)據(jù)(抽象)層,用于在任意數(shù)量的表中查詢數(shù)據(jù),這種格式是以任意格式的任意來源繪制的。
正確的方法是通過構建像柱狀數(shù)據(jù)庫和內存處理這樣的智能的、節(jié)省硬盤的方法來解決通常伴隨巨大數(shù)據(jù)集而來的問題。首先通過只加載正在用的數(shù)據(jù)簡化處理過程,而后確保將這些數(shù)據(jù)加載到計算機的主內存中,而不是占用RAM。這意味著你可以獲得完全的、不受限制的訪問所有數(shù)據(jù)的權限,而不需要像好萊塢山那樣大小的計算機來處理它。
一個唱歌、跳舞的超級巨星
更勝一籌的是,使用一個完整的BI系統(tǒng)消除了對非技術用戶可理解數(shù)據(jù)的額外軟件層的需求。
正如我們看到的,數(shù)據(jù)倉庫和Hadoop的不足之處在于它們是嚴格的“后端”解決方案——它們只處理外層數(shù)據(jù)。
為了使您的前端用戶能夠訪問數(shù)據(jù),您仍然需要引入和集成各種各樣的應用程序,這些應用程序允許業(yè)務團隊提取并可視化他們需要的見解。
雖然Hadoop是開源的,但它不是“免費的”。讓它做你想做的事情,并將它與你的數(shù)據(jù)倉庫集成,你的工具來處理和準備數(shù)據(jù)分析,以及前端的儀表板界面,要么需要大量的資源投入,要么需要引入第三方來管理它。另外,當然,你仍然需要投資它需要運行的硬件。
有了一個像樣的單棧替代,您可以查詢源數(shù)據(jù),使用ETL數(shù)據(jù)引擎快速處理它,并在一步生成新的報和表指示板。現(xiàn)在這種創(chuàng)新挑戰(zhàn)了數(shù)據(jù)倉庫、Hadoop或沒有Hadoop的未來。
所以,是的,也許是時候讓這個(國際)國家寶藏退后一步,讓下一代數(shù)據(jù)技術接手。但并不是因為Hadoop竊取了她的皇冠,而是因為單棧技術正在為BI提供冗余存儲數(shù)據(jù)解決方案。