如今,大數(shù)據(jù)越來越重要,因為企業(yè)需要處理來自多個來源的不斷增長的存儲數(shù)據(jù)。
采用大數(shù)據(jù)可以稱之為一場完美風暴。廉價的存儲和大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的大量涌入,導致了諸多的大型數(shù)據(jù)工具得以開發(fā),幫助企業(yè)“解鎖”他們積累的數(shù)據(jù),從客戶記錄到產(chǎn)品性能的結(jié)果等更多的數(shù)據(jù)。
像傳統(tǒng)的商業(yè)智能(BI),這些新的大數(shù)據(jù)工具可以分析過去的趨勢,并幫助企業(yè)識別重要模式,如特定的銷售趨勢。許多大數(shù)據(jù)工具現(xiàn)在提供了一個新一代預測和規(guī)范性的見解,以及深埋在企業(yè)數(shù)據(jù)中心的所有數(shù)據(jù)。
對于人們面臨的挑戰(zhàn),調(diào)查機構(gòu)Gartner公司分析師道格·蘭尼表示,人們還是不要用擴展的基礎(chǔ)設(shè)施來處理所有這些數(shù)據(jù),而是從各種數(shù)據(jù)本身進行處理。
“對于真正的挑戰(zhàn),企業(yè)對自己和客戶的交易數(shù)據(jù)進行處理、整合,并共同構(gòu)建和理解輸入,加上來自合作伙伴和供應商的數(shù)據(jù),還有一些外源性數(shù)據(jù),如社會媒體的開放數(shù)據(jù)和聚合數(shù)據(jù)等等,而這些只是觸及了表面。”蘭尼在一封電子郵件中說表示。
大數(shù)據(jù)是一個大問題:您的網(wǎng)絡(luò)準備好了嗎?
盡管Gartner的客戶端通過一個2比1的比例說明各種數(shù)據(jù)是一個更大的問題,對他們來說數(shù)據(jù)增長的速度越來越快,而數(shù)據(jù)處理供應商將會繼續(xù)提供資金更大、更快的解決方案。
ConstellationResearch公司分析師道格·亨森特表示,大數(shù)據(jù)解決方案肯定是不斷發(fā)展變化的。
“在我的書中,2014年是發(fā)布SQLHadoop公告的一年,但今年企業(yè)和銷售商開始認識到大數(shù)據(jù)的機會不只是擴大傳統(tǒng)的BI和數(shù)據(jù)庫。”亨森特說,“因此,ApacheSpark開源框架和其他的分析方案已在2015年超越了SQL。2015年,數(shù)百家供應商和大公司開始采用ApacheSpark開源框架,IIBM公司擁抱是倡導其他分析選項最明顯的廠商,而其他致力于數(shù)據(jù)集成和大數(shù)據(jù)平臺的很多企業(yè)加入這個行列。”
事實上,大數(shù)據(jù)浪潮似乎來臨,每天都會供應商推出的各種解決方案,其中也包括一些相對全面的設(shè)計。盡管很難得到一個全面的名單,這四個工具應該出在用戶的應用清單中。
(1)數(shù)據(jù)科學家的H2O.ai
H2O.ai是初創(chuàng)公司Oxdata在2014年底推出的一個獨立開源機器學習平臺,主要服務于數(shù)據(jù)科學家和開發(fā)者,為其應用提供快速機器學習引擎。Oxdata公司表示,可以在商用硬件上對任何來源(如Hadoop,SQL)的數(shù)據(jù)進行處理分析,甚至在上千個網(wǎng)絡(luò)節(jié)點或亞馬遜的AWS云運行。個人可以嘗試并繼續(xù)免費使用H2O.ai。Oxdata公司將收取企業(yè)用戶的費用。
“很多公司使用Spark代替Hadoop短期記憶,這就像大數(shù)據(jù)的內(nèi)存一樣。”H2O公司市場營銷和增長副總裁奧列格·羅格斯科說,“在讀取你的短期記憶方面,h20.ai的功能超越了Spark,基本上提供了超快速的分析能力。”
羅格斯科說,H2O.ai是旨在提供預測分析的數(shù)據(jù)工具的一個新品種。他指出,SQL幫助推動了描述性數(shù)據(jù)分析的早期階段或“告訴我發(fā)生了什么”,其次是“預測期”的產(chǎn)品,看看發(fā)生了什么事,盡量幫助客戶預測接下來會發(fā)生什么-例如:庫存用完或產(chǎn)品突破等。
“我們在未來幾年將看到第三個階段是指令性的階段發(fā)揮作用,這個系統(tǒng)說,‘這是我的教訓,我認為未來會發(fā)生什么,你應該最大限度地實現(xiàn)目標。’”羅格斯科說,他還指出,谷歌地圖的主動建議替代路線的能力就是一個規(guī)范性解決方案的例子。
H20.ai將自己定位為各種行業(yè)數(shù)據(jù)科學家使用的一個預測工具和“盒子”。例如,網(wǎng)絡(luò)巨頭思科公司有6萬款預測購買決策的模型,該公司使用H2O.ai對這些模型評分。思科公司首席數(shù)據(jù)科學家表示,“其結(jié)果是太棒了,我們看到H2O.ai比我們的同類產(chǎn)品的性能要好3到7倍。在單獨建模評分方面,h2o.ai環(huán)境是upwards的10到15倍。”
(2)ThoughtSpot3–大數(shù)據(jù)應用
借助谷歌公司這樣的搜索引擎,很容易在網(wǎng)上搜到用戶需要的社交數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù),但企業(yè)數(shù)據(jù)一般難以查找,也更難以利用。為此,7位工程師共同成立了ThoughtSpot公司,目標是開發(fā)一個類似于谷歌的搜索引擎,用于查找商業(yè)數(shù)據(jù)。
該公司在谷歌公司成立初期就為其提供硬件設(shè)備,在企業(yè)啟用防火墻后提供超快搜索功能。ThoughtSpot結(jié)合了新搜索引擎的應用,它的功能是通過一個快速內(nèi)存數(shù)據(jù)庫來搜尋海量信息。該公司還計劃提供一個基于云的服務。