2015年,大數(shù)據(jù)市場(chǎng)的發(fā)展迅猛,放眼國(guó)際,總體市場(chǎng)規(guī)模持續(xù)增加,隨著人工智能、物聯(lián)網(wǎng)的發(fā)展,幾乎所有人將目光瞄準(zhǔn)了“數(shù)據(jù)”產(chǎn)生的價(jià)值。行業(yè)廠(chǎng)商 Cloudera、DataStax 以及 DataGravity 等大數(shù)據(jù)公司已經(jīng)投入大量資金研發(fā)相關(guān)技術(shù),Hadoop 供應(yīng)商 Hortonworks 與數(shù)據(jù)分析公司 New Relic 甚至已經(jīng)上市。而國(guó)內(nèi),國(guó)家也將大數(shù)據(jù)納入國(guó)策。
我們邀請(qǐng)數(shù)夢(mèng)工場(chǎng)的專(zhuān)家妹子和你來(lái)聊聊 2015 年大數(shù)據(jù)行業(yè)九大關(guān)鍵詞,管窺這一年行業(yè)內(nèi)的發(fā)展。
戰(zhàn)略:國(guó)家政策
今年中國(guó)政府對(duì)于大數(shù)據(jù)發(fā)展不斷發(fā)文并推進(jìn),這標(biāo)志著大數(shù)據(jù)已被國(guó)家政府納入創(chuàng)新戰(zhàn)略層面,成為國(guó)家戰(zhàn)略計(jì)劃的核心任務(wù)之一:
2015年9月,國(guó)務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,大力促進(jìn)中國(guó)數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)將被作為戰(zhàn)略性資源加以重視;
2015年10月26日,在國(guó)家“十三五”規(guī)劃中具體提到實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。
挑戰(zhàn):BI(商業(yè)智能)
2015年對(duì)于商業(yè)智能(BI)分析市場(chǎng)來(lái)說(shuō),正由傳統(tǒng)的商業(yè)智能分析快速進(jìn)入到敏捷型商業(yè)智能時(shí)代。以 QlikView、Tableau和 SpotView 為代表的敏捷商業(yè)智能產(chǎn)品正在挑戰(zhàn)傳統(tǒng)的 IBM Cognos、SAP Business Objects 等以 IT 為中心的 BI 分析平臺(tái)。敏捷商業(yè)智能產(chǎn)品也正在進(jìn)一步細(xì)化功能以達(dá)到更敏捷、更方便、適用范圍更廣的目的。
崛起:深度學(xué)習(xí)/機(jī)器學(xué)習(xí)
人工智能如今已變得異常火熱,作為機(jī)器學(xué)習(xí)中最接近 AI(人工智能)的一個(gè)領(lǐng)域,深度學(xué)習(xí)在2015年不再高高在上,很多創(chuàng)新企業(yè)已經(jīng)將其實(shí)用化:Facebook 開(kāi)源深度學(xué)習(xí)工具“Torch”、PayPal 使用深度學(xué)習(xí)監(jiān)測(cè)并對(duì)抗詐騙、亞馬遜啟動(dòng)機(jī)器學(xué)習(xí)平臺(tái)、蘋(píng)果收購(gòu)機(jī)器學(xué)習(xí)公司 Perceptio ……同時(shí)在國(guó)內(nèi),百度、阿里,科大訊飛也在迅速布局和發(fā)展深度學(xué)習(xí)領(lǐng)域的技術(shù)。
共存:Spark/Hadoop
Spark 近幾年來(lái)越來(lái)越受人關(guān)注,2015年6月15日,IBM 宣布投入超過(guò)3500名研究和開(kāi)發(fā)人員在全球十余個(gè)實(shí)驗(yàn)室開(kāi)展與 Spark 相關(guān)的項(xiàng)目。
與 Hadoop 相比,Spark 具有速度方面的優(yōu)勢(shì),但是它本身沒(méi)有一個(gè)分布式存儲(chǔ)系統(tǒng),因此越來(lái)越多的企業(yè)選擇 Hadoop 做大數(shù)據(jù)平臺(tái),而 Spark 是運(yùn)行于 Hadoop 頂層的內(nèi)存處理方案。Hadoop 最大的用戶(hù)(包括 eBay 和雅虎)都在 Hadoop 集群中運(yùn)行著 Spark。Cloudera 和 Hortonworks 將 Spark 列為他們 Hadoop 發(fā)行的一部分。Spark 對(duì)于 Hadoop 來(lái)說(shuō)不是挑戰(zhàn)和取代相反,Hadoop 是 Spark 成長(zhǎng)發(fā)展的基礎(chǔ)。
火爆:DBaaS
隨著 Oracle 12c R2 的推出,甲骨文以全新的多租戶(hù)架構(gòu)開(kāi)啟了 DBaaS (數(shù)據(jù)庫(kù)即服務(wù)Database-as-a-Service)新時(shí)代,新的數(shù)據(jù)庫(kù)讓企業(yè)可以在單一實(shí)體機(jī)器中部署多個(gè)數(shù)據(jù)庫(kù)。在2015年,除了趨勢(shì)火爆,12c 多租戶(hù)也在運(yùn)營(yíng)商、電信等行業(yè)投入生產(chǎn)應(yīng)用。
據(jù)分析機(jī)構(gòu) Gartner 預(yù)測(cè),2012年至2016年公有數(shù)據(jù)庫(kù)云的年復(fù)合增長(zhǎng)率將高達(dá)86%,而到2019年數(shù)據(jù)庫(kù)云市場(chǎng)規(guī)模將達(dá)到140億美元。與傳統(tǒng)數(shù)據(jù)庫(kù)相比,DBaaS 能提供低成本、高敏捷性和高可擴(kuò)展性等云計(jì)算特有的優(yōu)點(diǎn)。
誘人:數(shù)據(jù)科學(xué)家
隨著行業(yè)的發(fā)展,人才顯得尤為重要,各公司都期待數(shù)據(jù)科學(xué)專(zhuān)業(yè)人才能夠挖掘數(shù)據(jù)信息,來(lái)幫助公司開(kāi)源節(jié)流。美國(guó)招聘網(wǎng)站 Glassdoor 的報(bào)告稱(chēng),數(shù)據(jù)科學(xué)家的平均年薪為118709美元(約合人民幣737550元),而程序員的平均年薪為64537美元(約合人民幣400974元)。
數(shù)據(jù)科學(xué)家能夠通過(guò)統(tǒng)計(jì)變成涉及、開(kāi)發(fā)和調(diào)用算法而支持業(yè)務(wù)決策;管理海量數(shù)據(jù);可視化數(shù)據(jù)以輔助理解。其需要具備三項(xiàng)基本技能:數(shù)學(xué)/統(tǒng)計(jì)、計(jì)算機(jī)能力、在特定業(yè)務(wù)領(lǐng)域的知識(shí),被《哈佛商業(yè)評(píng)論》評(píng)委二十一世紀(jì)最吸引人的職業(yè)。