似乎大數(shù)據(jù)這個工具讓我們非常惶恐。除了基礎(chǔ)設(shè)施的費用,還要雇傭那些能夠從各種來源得來的大量非結(jié)構(gòu)化信息中,發(fā)掘可行性操作意見的科學(xué)家。
但也許大數(shù)據(jù)并不如你所想象的那樣嚇人。根據(jù)微軟的消息,它準(zhǔn)備把自己定位為一個大數(shù)據(jù)企業(yè),利用商業(yè)智能(BI)工具為企業(yè)服務(wù)。
例如,該公司最近發(fā)布了2013 Excel數(shù)據(jù)資源管理器的預(yù)覽版,這是一個自助BI插件,它能夠更好的服務(wù)于日常業(yè)務(wù)工作人員(不僅僅是數(shù)據(jù)科學(xué)家),使得他們能夠更容易的從Hadoop這樣的大數(shù)據(jù)平臺等多種來源得來的數(shù)據(jù)里發(fā)掘價值。
微軟最近還宣布推出SQL Server 2012并行數(shù)據(jù)倉庫(PDW),這是一個專為Hadoop的整合而設(shè)計的大規(guī)模并行處理數(shù)據(jù)倉庫設(shè)備。
這給我們帶來了有關(guān)大數(shù)據(jù)的困惑:它們究竟是什么?微軟會怎樣利用它?
第一個觀點:微軟的SQL Server總經(jīng)理在其最近的博客里面寫道,企業(yè)的IT堆棧很難支持大數(shù)據(jù),因為這必然帶來基礎(chǔ)設(shè)施和可擴(kuò)展性方面的困境。
一個組織可能并不需要大數(shù)據(jù)解決方案所需要的服務(wù)器以及其他硬件的機(jī)架。Kelly表示說:“相反,一個實惠的解決方案應(yīng)該提供存儲和處理大量數(shù)據(jù)的能力,同時消除任何前期基礎(chǔ)設(shè)施的成本,因為你只支付了你所需要的存儲和計算能力。”
微軟的Windows Azure HDInsight Service就符合這樣的描述,我們對此一點也不感到奇怪。但Kelly的意見對于那些貨比三家、想從其他供應(yīng)商獲得大數(shù)據(jù)解決方案的企業(yè)仍然是有用的。
微軟發(fā)表的第二個觀點是即將到來的數(shù)據(jù)科學(xué)家的短缺:企業(yè)不能找到足夠合格的大數(shù)據(jù)大師,從如社會媒體內(nèi)容和機(jī)器的傳感器數(shù)據(jù)這樣的非結(jié)構(gòu)化信息源中,發(fā)現(xiàn)前瞻性的見解。
Kelly說:“這個行業(yè)需要更多的數(shù)據(jù)科學(xué)家,雖然現(xiàn)在大多數(shù)機(jī)構(gòu)都配備了他們所需要的員工,能夠幫助他們從數(shù)據(jù)中提出寶貴的見解,從而改善他們的業(yè)務(wù)。”
換句話說,大數(shù)據(jù)的工具和應(yīng)用程序在當(dāng)今是夠用的。微軟的說法主要是基于所謂的數(shù)據(jù)運動的民主化。流行的工具,如Excel數(shù)據(jù)瀏覽器插件(Excel with the Data Explorer add-in),能夠允許終端用戶直接進(jìn)行(商業(yè)智能)BI分析,而不用IT的幫助。
第三個觀點:大數(shù)據(jù)是機(jī)會,也是挑戰(zhàn)。
OK,這可能聽起來像市場營銷的胡言亂語,但這里其實是有幾分真實的。實現(xiàn)大數(shù)據(jù)平臺,既是一個大難題,也是一個重要的機(jī)會。但是,不要讓前者阻止你追求后者的步伐。
微軟的技術(shù)研究員戴維·坎伯說道:“我經(jīng)常問自己,大數(shù)據(jù)的最終價值在哪里以及我應(yīng)該怎么進(jìn)入。在我的腦海里,這兩個關(guān)鍵點無非是時間洞察力以及可訪問數(shù)據(jù)的回報率。這兩個關(guān)鍵點,又反過來幫助信息生產(chǎn)的過程。”
Campbell表示,信息的生產(chǎn)是將數(shù)據(jù)從一個域轉(zhuǎn)移到另一個域的過程。良好的信息生產(chǎn)工具使企業(yè)能夠在更短的時間內(nèi)獲得業(yè)務(wù)洞察力。有了大數(shù)據(jù)這個工具的加入,你就擁有更廣泛的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)去發(fā)掘。他表示說“這些工具可以讓你非常迅速地從直覺階段跨越到驗證階段。”