我們?nèi)绾卫斫獯髷?shù)據(jù)?大家一提到大數(shù)據(jù)都會(huì)想TB級(jí)的數(shù)鉆,或者是結(jié)構(gòu)化半結(jié)構(gòu)化的數(shù)據(jù)。其實(shí)我們這個(gè)行業(yè)考慮大數(shù)據(jù)的時(shí)候主要是考慮處理大數(shù)據(jù)的工具。比如說(shuō)關(guān)系型數(shù)據(jù)庫(kù),但是我們發(fā)現(xiàn)關(guān)系型數(shù)據(jù)庫(kù)有一些傳統(tǒng)的處理根本不能適應(yīng)大數(shù)據(jù)的需要。大數(shù)據(jù)不僅關(guān)乎于數(shù)據(jù),也不關(guān)乎處理的工具,大數(shù)據(jù)它含有的商業(yè)價(jià)值比一般的數(shù)據(jù)大很多。世界上任何國(guó)家地區(qū)都認(rèn)識(shí)到了數(shù)據(jù)能變現(xiàn)能產(chǎn)生很多業(yè)務(wù)模式。
從另一個(gè)角度探討這個(gè)問(wèn)題,比如說(shuō)英特爾的Hadoop這方面非常先進(jìn),尤其我們?cè)谥袊?guó)市場(chǎng)地位非常穩(wěn)固。以前我們是一個(gè)芯片公司,現(xiàn)在我們開始關(guān)注Hadoop以及一些軟件。我們發(fā)現(xiàn)通過(guò)Hadoop和軟件的結(jié)合可以更好的利用大數(shù)據(jù)所帶來(lái)的商業(yè)機(jī)會(huì)。幾年以前我們跟中國(guó)合作伙伴的合作模式跟現(xiàn)在不一樣了,這是因?yàn)閯?chuàng)新引起的。之前跟中國(guó)合作會(huì)發(fā)現(xiàn)中國(guó)移動(dòng)每年會(huì)產(chǎn)生很多數(shù)據(jù)量,而且數(shù)據(jù)量提升了30倍,對(duì)于一些運(yùn)營(yíng)商來(lái)講,如果你提交的查詢需要30秒的時(shí)間你是接受不了的,1秒還可以,現(xiàn)在大數(shù)據(jù)能夠使得這些公司更接近于他們的用戶并且為用戶提供更好的服務(wù)。
大數(shù)據(jù)在智慧城市領(lǐng)域也有很大的影響。中國(guó)正在快速的發(fā)展中,智慧城市利用一些圖像的控制和監(jiān)控的視頻來(lái)提升交通流量、提升交通的順暢度,比如重慶就利用了監(jiān)控?cái)?shù)據(jù)的數(shù)據(jù)提升公共安全或者交通的便利性。在北京或者其它地方跟很多年前相比是有很大的不同的,如果有智慧城市項(xiàng)目在這兒進(jìn)行的話,我相信大家上二環(huán)、三環(huán)肯定不會(huì)像現(xiàn)在這么沮喪了。
大數(shù)據(jù)很有作為的地方就是醫(yī)療健康領(lǐng)域。比如得癌癥的人,我的一個(gè)同事很多年前得了腎癌,當(dāng)時(shí)用的是傳統(tǒng)的治療癌癥的藥品,但是當(dāng)時(shí)我的同事利用大數(shù)據(jù)破解癌癥基因組的秘密。他覺(jué)得這個(gè)結(jié)果看起來(lái)更像是胰腺癌,后來(lái)將治來(lái)藥物做了調(diào)整,過(guò)了幾個(gè)月他就得到了一個(gè)很好的治療,并且延長(zhǎng)了他的壽命。如果我們能夠把這個(gè)做成大眾都能用得起的服務(wù)的話,那么是令人激動(dòng)的,比如基因的破解、以及治療各種疾病過(guò)程中,這是我對(duì)大數(shù)據(jù)的期待。
Hadoop不可能解決所有大數(shù)據(jù)的問(wèn)題
英特爾的目標(biāo):大約幾年前從谷歌一直到雅虎,Hadoop成為了一個(gè)開源性的大數(shù)據(jù)應(yīng)用工具。Hadoop不可能解決所有大數(shù)據(jù)的問(wèn)題,Hadoop本身也不是一個(gè)所謂的解決方案。但是我們相信,Hadoop這個(gè)框架它是一個(gè)非?;A(chǔ)的框架,能夠使得數(shù)據(jù)的各種結(jié)構(gòu)應(yīng)用放在Hadoop的基礎(chǔ)之上。在傳統(tǒng)的產(chǎn)業(yè)當(dāng)中,很多人如果能用到Hadoop更簡(jiǎn)化的架構(gòu)的話,能夠給他們工作帶來(lái)很大的幫助,我們相信Hadoop有非常大的潛力,使它更容易部署,成本更低。并且也能用到更廣泛的應(yīng)用領(lǐng)域當(dāng)中。
因此我們?cè)诟鱾€(gè)領(lǐng)域當(dāng)中對(duì)Hadoop進(jìn)行改進(jìn)。比方說(shuō)實(shí)時(shí)的分析更靈活。當(dāng)今的Hadoop是一種批處理工具,只能提供有限的價(jià)值。但是我們現(xiàn)在要把它打造成下一個(gè)平臺(tái)的話它能有更廣泛的應(yīng)用和更大的能力。
現(xiàn)在大數(shù)據(jù)面臨什么樣的問(wèn)題?比方說(shuō)安全、實(shí)時(shí)響應(yīng)、環(huán)境的負(fù)載度、實(shí)現(xiàn)業(yè)務(wù)價(jià)值途徑等等。很多公司一開始都是考慮要存儲(chǔ)什么樣的數(shù)據(jù)以及可以從這些數(shù)據(jù)分析當(dāng)中得到什么樣的價(jià)值?這是大部分公司所想的問(wèn)題。這些先進(jìn)的公司確實(shí)是在考慮價(jià)值模式的創(chuàng)新。但是大部分的公司還是在考慮到底該怎么辦?原因之一是因?yàn)閺?fù)雜度,因?yàn)橛泻芏喙ぞ叱霈F(xiàn)需要人們學(xué)會(huì)相應(yīng)的技術(shù)掌控它們。我們從數(shù)據(jù)當(dāng)中得到的一些分析,如果能夠?qū)崟r(shí)一點(diǎn)的話才會(huì)起到真正的作用。我們要解決這些問(wèn)題,如果采用高度集成或者垂直基站方式來(lái)做的話,可能對(duì)于很多用戶來(lái)說(shuō)是可以的。但是英特爾認(rèn)為,開放性能夠使得我們?cè)陂L(zhǎng)期內(nèi)獲得更快、更大的增長(zhǎng)。對(duì)于高度集成或者私有的封閉方案可能能很快的解決問(wèn)題,但是長(zhǎng)期來(lái)說(shuō)對(duì)于大數(shù)據(jù)更長(zhǎng)期的價(jià)值實(shí)現(xiàn)是不利的。
如果我們有一個(gè)開放性的可操作的基礎(chǔ)或者框架,當(dāng)然是以Hadoop為基礎(chǔ),但是要超越這個(gè)基礎(chǔ)才能夠?qū)崿F(xiàn)開放環(huán)境下的各種服務(wù)和應(yīng)用實(shí)現(xiàn),為整個(gè)行業(yè)帶來(lái)利益。