文|張曉東
摘要:本文簡(jiǎn)單分析了大數(shù)據(jù)這個(gè)領(lǐng)域內(nèi),不同類型的公司大數(shù)據(jù)的理念和做法有哪些不同。大數(shù)據(jù)到底是BI Plus,還是一個(gè)大的智能平臺(tái)?IBM、Oracle等大IT公司怎么看待大數(shù)據(jù)?Google、Baidu等互聯(lián)網(wǎng)的巨頭們?cè)趺纯创髷?shù)據(jù)?
先聲明一下,本文是給對(duì)于大數(shù)據(jù)和IT知識(shí)有一定基礎(chǔ)的朋友看的,不是普及大數(shù)據(jù)基本概念的,對(duì)某些詞匯和說(shuō)法需要你自己去查看一些相關(guān)資料。當(dāng)然本文也不談什么高深技術(shù),談的是不同的公司做大數(shù)據(jù)這個(gè)生意的理念和戰(zhàn)略思路。
我先說(shuō)一個(gè)基礎(chǔ),然后再討論本文的具體問(wèn)題。關(guān)于大數(shù)據(jù)的說(shuō)法很多,有理解的不同,也有出于不同同目的,而導(dǎo)致的理解和說(shuō)法不同。大數(shù)據(jù)最早脫胎于原來(lái)的經(jīng)營(yíng)分析BI(Business Intelligence),而BI是為了解決人們對(duì)于企業(yè)經(jīng)營(yíng)數(shù)據(jù)多維度的分析和洞察,從而支撐企業(yè)領(lǐng)導(dǎo)人做決策。
大數(shù)據(jù)的概念,不管是4V(Volume、Velocity、Variety、Value)還是5V(多了一個(gè)Veracity)等各種定義,還是全體數(shù)據(jù)、快速處理、相關(guān)關(guān)系等三大大數(shù)據(jù)核心特征,這些都是偏理論化的理解,是最基礎(chǔ)的東西,這里就不去細(xì)說(shuō)了。在實(shí)際的大數(shù)據(jù)應(yīng)用中可以看成兩種類型:
1)加入大數(shù)據(jù)元素的BI革新,可以看作BI Plus。除了分析企業(yè)內(nèi)部經(jīng)營(yíng)類信息之外,還可以融入大量以前看起來(lái)不相關(guān)和不可利用的數(shù)據(jù),圖片、日志、社交及其數(shù)據(jù)等等都在它的范疇之內(nèi)。
2)大數(shù)據(jù)大平臺(tái),是以海量數(shù)據(jù)為核心,進(jìn)行復(fù)雜行業(yè)建模和大量自學(xué)習(xí),數(shù)據(jù)來(lái)源于各種渠道。最終形成一個(gè)統(tǒng)一的大數(shù)據(jù)服務(wù)平臺(tái)。
總的來(lái)說(shuō),很多大的IT公司其實(shí)提供的是BI Plus大數(shù)據(jù)解決方案,而大的互聯(lián)網(wǎng)公司做的其實(shí)是第二種。從宣傳上,它們都被稱為大數(shù)據(jù)。
接下來(lái)我以問(wèn)題和回答的方式來(lái)闡述這兩種大數(shù)據(jù)是如何存在于市場(chǎng)格局上的:
大數(shù)據(jù)來(lái)了,帶來(lái)的數(shù)據(jù)洪水,當(dāng)然對(duì)于傳統(tǒng)IT廠商來(lái)看,是支撐大數(shù)據(jù),例如Cisco、IBM、Oracle、HP等,但是無(wú)一例外的是,他們走的是高端路線,和互聯(lián)網(wǎng)廠商支撐大數(shù)據(jù)的大相徑庭。行業(yè)對(duì)此的看法也是不一致的,大數(shù)據(jù)應(yīng)該是低成本,還是高成本的?
關(guān)于所謂的高端路線,對(duì)于Oracle、IBM這類大公司,可以這么理解,他們關(guān)注的是大、中型企業(yè)客戶中的大數(shù)據(jù)銷售機(jī)會(huì),并且?guī)в泻芏嗟男袠I(yè)屬性。
基于傳統(tǒng)IT列強(qiáng)在對(duì)行業(yè)理解和行業(yè)解決方案成熟度、渠道合作伙伴、ISV等領(lǐng)域的基礎(chǔ),他們選擇這些能為他們帶來(lái)收入的中高端客戶作為目標(biāo)。從銷售上看,主要是銷售大數(shù)據(jù)解決方案,而不是大數(shù)據(jù)服務(wù),行業(yè)知識(shí)、領(lǐng)域?qū)<业荣Y源需要靠IT大公司的原有行業(yè)合作伙伴來(lái)提供助力。
這些IT公司提供大數(shù)據(jù)解決方案,本身算不上大數(shù)據(jù)的用戶,但是不妨礙他們開發(fā)出市場(chǎng)上具有競(jìng)爭(zhēng)力的大數(shù)據(jù)解決方案,當(dāng)然,將來(lái)IT列強(qiáng)們也會(huì)把大數(shù)據(jù)大量用在公司內(nèi)部。
互聯(lián)網(wǎng)公司通常對(duì)于行業(yè)(非IT行業(yè))積累的底蘊(yùn)要差很多,互聯(lián)網(wǎng)的大數(shù)據(jù)通常是以通過(guò)大數(shù)據(jù)為自己產(chǎn)生價(jià)值為主,他們首先是大數(shù)據(jù)用戶,然后才會(huì)考慮去輸出大數(shù)據(jù)的價(jià)值。
這就決定了兩者對(duì)于大數(shù)據(jù)的出發(fā)點(diǎn)、說(shuō)法和做法不同。它們之間完全是互相理解的,但是并不妨礙在公開場(chǎng)合的爭(zhēng)論和相互打擊,這畢竟是商業(yè)社會(huì)。
總的來(lái)說(shuō),大中型企業(yè)有能力自己購(gòu)買和構(gòu)建大數(shù)據(jù)解決方案,作為內(nèi)部使用,這些企業(yè)在大數(shù)據(jù)IT方面的收入可以支撐IT廠商的收入增長(zhǎng)。而大數(shù)據(jù)的真正大平臺(tái),還需要靠互聯(lián)網(wǎng)公司來(lái)推動(dòng)。
大數(shù)據(jù)技術(shù)的進(jìn)步,無(wú)論互聯(lián)網(wǎng)公司還是IT公司都會(huì)做出自己的貢獻(xiàn),但是目前看起來(lái),傳統(tǒng)IT公司目標(biāo)是大中型客戶,而互聯(lián)網(wǎng)公司目標(biāo)是中小型客戶;互聯(lián)網(wǎng)公司的優(yōu)勢(shì)在于他們具有大數(shù)據(jù)運(yùn)營(yíng)和服務(wù)的能力,這個(gè)在未來(lái)將會(huì)產(chǎn)生很大影響。
大數(shù)據(jù)分析最終的結(jié)果一定是結(jié)構(gòu)化的,這樣看來(lái)傳統(tǒng)的BI的價(jià)值更大。目前IT公司們都在宣揚(yáng)這個(gè)理念,他們采用什么樣的策略?
我不完全認(rèn)同大數(shù)據(jù)的分析結(jié)果一定是結(jié)構(gòu)化的這一個(gè)說(shuō)法,雖然目前看起來(lái)是這樣。我覺(jué)得真正的核心在于大數(shù)據(jù)的分析結(jié)果是可視化的和可理解的。結(jié)構(gòu)化還是非結(jié)構(gòu)化都只是可視化之前的狀態(tài)和步驟。