同時,由于這些擁有大量數(shù)據(jù)資源的企業(yè),在分析挖掘數(shù)據(jù)形成應(yīng)用的同時,放棄直接依靠出售數(shù)據(jù)獲利,而選擇對外提供數(shù)據(jù)服務(wù)和分析結(jié)果,為應(yīng)用類企業(yè)的決策和東西提供了便利條件。這也是應(yīng)用類的數(shù)據(jù)企業(yè)或產(chǎn)品數(shù)量較大,占到了行業(yè)總數(shù)的三分之一的重要原因。
而對于部分中小企業(yè)而言,資金缺乏和技術(shù)難題導(dǎo)致數(shù)據(jù)獲取難,缺乏數(shù)據(jù)資產(chǎn)管理意識,其對大數(shù)據(jù)的使用,仍在探路中。
另外,我國的大數(shù)據(jù)應(yīng)用領(lǐng)域分布仍然不夠全面,相關(guān)企業(yè)主要集中在互聯(lián)網(wǎng)、市場營銷、電信、金融領(lǐng)域,而政府公共服務(wù)、農(nóng)業(yè)類應(yīng)用,發(fā)展還在原始階段,近期個別企業(yè)還不時爆出數(shù)據(jù)造假的傳聞。同時,數(shù)據(jù)應(yīng)用的方式單一,思路狹窄,一些企業(yè)盲目學(xué)習(xí)國外的數(shù)據(jù)應(yīng)用模式,也是大數(shù)據(jù)應(yīng)用企業(yè)發(fā)展的一大短板。
搶占數(shù)據(jù)分析高地
如果說大數(shù)據(jù)的應(yīng)用,是大數(shù)據(jù)產(chǎn)業(yè)的商業(yè)價值終端,那么大數(shù)據(jù)行業(yè)公認的大數(shù)據(jù)分析,將會是大數(shù)據(jù)產(chǎn)業(yè)的核心,是大數(shù)據(jù)能夠點石成金的關(guān)鍵。
這樣的判斷是基于大數(shù)據(jù)的特性。數(shù)據(jù)本身不產(chǎn)生價值,當(dāng)數(shù)據(jù)經(jīng)過挖掘、歸類和分析,能夠給企業(yè)決策提供幫助之后,才具有價值。
數(shù)據(jù)堂公司今年發(fā)布了一份《大數(shù)據(jù)產(chǎn)業(yè)調(diào)研及分析報告》,其中將大數(shù)據(jù)分析工作歸類為商業(yè)分析、語音識別、圖像分析、實時處理、空間分析、基因分析、用戶分析、日志分析,和數(shù)據(jù)可視化等九個種類。目前,國內(nèi)在各個領(lǐng)域都已出現(xiàn)了一批相關(guān)大數(shù)據(jù)企業(yè)。
與上述橫向劃分不同,另一些看法則偏向?qū)⒋髷?shù)據(jù)分析按商業(yè)價值的高低進行區(qū)分。前LinkedIn商業(yè)分析部總監(jiān),GrowingIO的創(chuàng)始人張溪夢介紹說,在數(shù)據(jù)分析發(fā)展更早的美國,數(shù)據(jù)分析區(qū)塊已經(jīng)按商業(yè)價值從低到高地細分為數(shù)據(jù)采集、大數(shù)據(jù)架構(gòu)、響應(yīng)性分析,診斷性分析、戰(zhàn)略性分析、預(yù)測性分析和全自動分析。而一旦做到數(shù)據(jù)分析全自動化,將會利用10%的時間,創(chuàng)造出這個行業(yè)90%的價值。
在美國數(shù)據(jù)分析領(lǐng)域工作十余年的張溪夢認為,“數(shù)據(jù)分析前端過程復(fù)雜,分析昂貴,導(dǎo)致在過去若干年里,數(shù)據(jù)科學(xué)家90%的時間和工作都是進行數(shù)據(jù)清洗、整理、傳輸和存儲,但真正產(chǎn)生價值的是剩下的10%。我們必須要利用各種先進技術(shù),把金字塔底部做得非常狹窄,把以往很緩慢的流程縮短甚至透明化。”
21世紀經(jīng)濟報道記者獲悉,目前國內(nèi)的數(shù)據(jù)分析產(chǎn)品,在與國外產(chǎn)品的競爭中仍處劣勢。以日志搜索系統(tǒng)為例,雖然國內(nèi)已有自主研發(fā)的日志實時搜索分析引擎面世,但市場使用的主流還是HADOOP、STORM和SPARK等國外開放計算框架下的產(chǎn)品,有部分互聯(lián)網(wǎng)和金融企業(yè)則選擇了SPLUNK等第三代日志搜索軟件包,這同樣也是美國開發(fā)的大數(shù)據(jù)工具。
然而國內(nèi)企業(yè)并非毫無競爭力,日志搜索分析引擎“日志易”的創(chuàng)始人兼CEO陳軍介紹,這些國外數(shù)據(jù)搜索處理系統(tǒng)價格非常昂貴,同時由于之前的“棱鏡門”事件,國外系統(tǒng)的軟件后門也令一些國內(nèi)的企業(yè)尤其是金融企業(yè)擔(dān)憂。
人才短缺是限制國內(nèi)大數(shù)據(jù)分析企業(yè)發(fā)展的另一大主因?!豆鹕虡I(yè)評論》曾將數(shù)據(jù)分析師稱為“21世紀最性感的職業(yè)”,當(dāng)下也是稀缺和搶手的職業(yè)。鄂維南院士介紹,我國大數(shù)據(jù)發(fā)展最大的優(yōu)勢是龐大的市場,最大的劣勢是缺乏人才,“我們國家目前沒有建立起非常好的培養(yǎng)大數(shù)據(jù)人才的機制,在大數(shù)據(jù)涉及的統(tǒng)計、機械學(xué)習(xí)等這些領(lǐng)域相比而言更加弱勢。”
滴滴快的CEO程維在講述如何到硅谷挖人時提到,人才是最大的瓶頸,中國沒有那么多的大數(shù)據(jù)和機器算法的科學(xué)家,后來發(fā)現(xiàn)硅谷一線的互聯(lián)網(wǎng)企業(yè),像Uber、Facebook里面20%的工程師是華人。“我們派了CTO和一個代表團在硅谷把他們請到一起交流。”程維說。
鄂維南認為,大數(shù)據(jù)分析人才的缺乏,當(dāng)下數(shù)據(jù)人才市場,不僅有國內(nèi)和國外的競爭,學(xué)術(shù)界與企業(yè)界也在競爭。要想彌補人才短缺,在大數(shù)據(jù)領(lǐng)域取得領(lǐng)先地位,需要建立一個開放的,既可以做科研也可以產(chǎn)業(yè)化做市場的國際標(biāo)準(zhǔn)的研究平臺,或是解決之道。
數(shù)據(jù)平臺期待全覆蓋
相對大數(shù)據(jù)分析企業(yè)的專業(yè)和專一定位,產(chǎn)業(yè)覆蓋面廣的大數(shù)據(jù)平臺類企業(yè),則是在國際大數(shù)據(jù)大會的企業(yè)展廳中,占比最高的行業(yè)類型。
一位參展的大數(shù)據(jù)平臺商人告訴記者,“大數(shù)據(jù)平臺會是大數(shù)據(jù)行業(yè)的基石和中堅。”據(jù)了解,阿里,百度,華為等企業(yè)都早已布局大數(shù)據(jù)平臺,阿里云更是從2010年就對外開放了其在云計算領(lǐng)域的技術(shù)服務(wù)。