IDC的大數(shù)據(jù)市場預測,大數(shù)據(jù)將會迎來大時代。分析公司表示截止到2015年大數(shù)據(jù)產(chǎn)值將達169億美元。不過我們尚不明確,這個市場有多新,或者除了大數(shù)據(jù)新興企業(yè)是否真正會刮起一個淘金熱。
這是開源的炒作嗎?按大數(shù)據(jù)的風格重演?
可能是的。開源在科技新聞界風行了好幾年,因為它曾承諾能夠降低成本同時獲得企業(yè)級的IT自由度。最終,只有幾個新興企業(yè)投資(MySQL, JBoss),但是對于大部分的企業(yè)而言,真正的價值來自IT供應商和內(nèi)部的IT組織,利用開源為他們的軟件項目提供原材料。開源越來越不關(guān)于銷售,而是代碼,這也正是設(shè)計它的目的所在。
如今,很多的風險投資家將大量的錢投入大數(shù)據(jù)新興企業(yè)希望能夠致富,一些人也確實做到了。但是請弄清楚:數(shù)據(jù)分析長久以來都是技術(shù)產(chǎn)業(yè)的一部分。
現(xiàn)在我們可能把它叫作“大數(shù)據(jù)”,但是它至少是未來20年來一個遠瞻性的產(chǎn)業(yè),一位博主這樣寫道。
把它叫作數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、又或者商業(yè)分析。隨便你喜歡叫什么都可以。它并不新,甚至不一定是游戲規(guī)則的改變者,但是很多行業(yè)長期都需要優(yōu)化數(shù)據(jù)收集和分析,所以技術(shù)提高就變得很有意義了。
然而,這里有兩方面是新的大數(shù)據(jù)(也可以是開源)所要注意的:成本和規(guī)模。
這兩個因素,可能比別的都重要,Hadoop的驚人增長甚至讓 “數(shù)據(jù)挖掘”失去了昔日的地位。Hadoop使得收集和分析數(shù)據(jù)變得低成本、便于擴展,形成商業(yè)化的硬件。在過去,運行信貸業(yè)務(wù)的金融服務(wù)公司,不得不給IBM支付巨額支票用于專業(yè)的硬件和軟件。
不會再這樣了。Hadoop有大量大眾化的數(shù)據(jù),將其轉(zhuǎn)化為有競爭力的市場。
Hadoop不是憑空出現(xiàn)的。各種其它的事情,例如包括提升基礎(chǔ)設(shè)施、移動設(shè)備和社會數(shù)據(jù),都將使與Hadoop高度相關(guān)的人群受益。重要的是,在開源以前,Hadoop和大數(shù)據(jù)移動的真正價值被企業(yè)內(nèi)部所有,而沒有支付給不同的供應商。是的,這對于Hadoop新興企業(yè)會有很好的出路,但是更大的贏者是內(nèi)部的Hadoop專業(yè)知識獲得發(fā)展。
總之,大數(shù)據(jù)就是大。但是它并不新,創(chuàng)新的地方是通過處理大量數(shù)據(jù)而降低數(shù)據(jù)倉庫的花費。與開源相似,大部分大數(shù)據(jù)的價值被內(nèi)部團隊所用,讓他們知道如何將專業(yè)知識應用于他們所收集的數(shù)據(jù)。好消息是,一些企業(yè)將會從大數(shù)據(jù)的“淘金熱”中致富。
更好的消息是,大部分富起來的企業(yè)還將繼續(xù)使用Hadoop和大數(shù)據(jù)技術(shù)。