團(tuán)隊(duì)方面,我們一方面是本地化,凌琦是Cloudera公司副總裁和肯睿(上海)軟件有限公司總經(jīng)理,他在英特爾工作了20年。另一方面是與英特爾的合作。英特爾向Cloudera投資了7.4億美金,持有18%的股份,我們?cè)诋a(chǎn)品和技術(shù)和團(tuán)隊(duì)上有廣泛的合作。
凌琦:我來(lái)談?wù)勚袊?guó)這邊的情況,第一個(gè)方面的工作是把以前英特爾的Hadoop分發(fā)版的中國(guó)客戶(hù),轉(zhuǎn)換到Cloudera平臺(tái)上來(lái)。這些客戶(hù)主要是在金融領(lǐng)域,包括銀行、證券、保險(xiǎn)等。在此基礎(chǔ)上,我們也發(fā)現(xiàn)中國(guó)市場(chǎng)對(duì)大數(shù)據(jù)的需求在快速增長(zhǎng),比如說(shuō)電信業(yè),它積累了大量的數(shù)據(jù)和客戶(hù)行為數(shù)據(jù),這些信息會(huì)有很大價(jià)值可以挖掘。
我們還看到智慧城市。中國(guó)的智慧城市建設(shè)非常熱,這里面也是靠數(shù)據(jù)來(lái)支持,比如說(shuō)交通管理,比如說(shuō)在商業(yè)分布,甚至說(shuō)對(duì)于城市安全的管理都有非常好的應(yīng)用。
另外,大數(shù)據(jù)在生命科學(xué)方面、醫(yī)藥研究方面以及流行病趨勢(shì)方面,也會(huì)有很多應(yīng)用。
記者:Cloudera在中國(guó)與英特爾將在哪些方面共享資源?
Mike Olson:我們跟英特爾的溝通當(dāng)中會(huì)發(fā)現(xiàn)很多大數(shù)據(jù)潛在的問(wèn)題,我們可以通過(guò)和英特爾或者與英特爾共享的合作伙伴渠道一起提供一個(gè)大數(shù)據(jù)整體解決方案。我們說(shuō)到的智慧城市、平安城市都是非常典型的大數(shù)據(jù)應(yīng)用場(chǎng)景案例。
何京翔:英特爾在上海的大數(shù)據(jù)開(kāi)發(fā)團(tuán)隊(duì),與Cloudera在開(kāi)源上有很多的合作;另一方面,我們?cè)诠灿锌蛻?hù)和新客戶(hù)方面也會(huì)合作,來(lái)更好滿(mǎn)足客戶(hù)需求。
我本身在英特爾軟件及服務(wù)事業(yè)部工作,這個(gè)部門(mén)一個(gè)主要的任務(wù)是使得軟件能夠在英特爾平臺(tái)上跑得最好,所以具體落實(shí)到大數(shù)據(jù)這塊,就是怎么樣讓Hadoop、Spark這些新的軟件平臺(tái)在英特爾平臺(tái)上得到最好的優(yōu)化,把我們軟硬結(jié)合做到最好。
與傳統(tǒng)數(shù)據(jù)挖掘是互補(bǔ)關(guān)系
記者:有很多力量在推動(dòng)大數(shù)據(jù)發(fā)展,其中比較典型的包括傳統(tǒng)IT公司面對(duì)大數(shù)據(jù)的轉(zhuǎn)型,以及新興的創(chuàng)業(yè)公司。你怎么看這兩類(lèi)公司的優(yōu)劣勢(shì)?
Mike Olson:像Oracle、IBM、Teradata這些傳統(tǒng)的數(shù)據(jù)庫(kù)或者數(shù)據(jù)挖掘廠商,其實(shí)他們?cè)谧约荷瞄L(zhǎng)的部分已經(jīng)做得非常好、非常成功,有非常成熟的解決方案。隨著時(shí)間的發(fā)展,我們現(xiàn)在已經(jīng)看到越來(lái)越多的應(yīng)用場(chǎng)景和新技術(shù)加入到Hadoop平臺(tái)。正如多年以前谷歌發(fā)表了三篇論文,MapReduce、Bigtable、GFS,三篇論文就是Hadoop的原形。Hadoop也是受到這三篇論文的啟發(fā)。
我認(rèn)為這兩種模式更多的是優(yōu)勢(shì)互補(bǔ)。我們現(xiàn)在看到Cloudera做的大數(shù)據(jù)平臺(tái)和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)EDW數(shù)據(jù)平臺(tái)并不是競(jìng)爭(zhēng)的關(guān)系,因?yàn)槲覀兛梢越o他們提供更多的數(shù)據(jù),更多種類(lèi)的數(shù)據(jù),不論是從量、種類(lèi)還是數(shù)據(jù)類(lèi)型都會(huì)遠(yuǎn)遠(yuǎn)超過(guò)過(guò)去EDW數(shù)據(jù)能夠處理的范圍。有了這些數(shù)據(jù),用戶(hù)還是可以用他們熟悉的數(shù)據(jù)分析和建模以及數(shù)據(jù)挖掘的工具,比如說(shuō)Teradata,比如說(shuō)MicroStrategy這樣的東西去發(fā)掘數(shù)據(jù)的價(jià)值。
也就是說(shuō),我們這兩個(gè)方案完全是互補(bǔ)的關(guān)系,我們可以給他提供更多種類(lèi)的數(shù)據(jù),讓他們從中挖掘更多的價(jià)值給到用戶(hù)。
這里想強(qiáng)調(diào)一下我們跟合作伙伴良好的關(guān)系,舉幾個(gè)例子,今年10月份,我們宣布了很多合作,比如說(shuō)跟Teradata、微軟、EMC,以及我們跟Oracle做了一體機(jī),這些都是非常好的樣板,會(huì)告訴大家我們跟這些傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘公司并不是競(jìng)爭(zhēng)的關(guān)系,而是良好的合作關(guān)系。
在Cloudera過(guò)去六年半的歷史上,我們已經(jīng)做到了在大數(shù)據(jù)領(lǐng)域最大,也是最好的分發(fā)版提供商,這也是我們跟合作伙伴持續(xù)創(chuàng)新、共同發(fā)展、共同成長(zhǎng)的一個(gè)結(jié)果。
大數(shù)據(jù)平臺(tái)作為一個(gè)新生的產(chǎn)品或者一個(gè)業(yè)界的發(fā)展動(dòng)態(tài),畢竟現(xiàn)在還是一個(gè)早期的階段,對(duì)Cloudera這樣的新興的創(chuàng)業(yè)公司來(lái)講,在這方面肯定有優(yōu)勢(shì),船小好掉頭,這也是大家容易理解的。
記者:美國(guó)大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)非?;钴S,有很多融資、并購(gòu)的案例。目前中國(guó)大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)也在增多。你對(duì)這樣的創(chuàng)業(yè)公司有什么建議?
Mike Olson:一是對(duì)這些新興的中國(guó)的創(chuàng)業(yè)的大數(shù)據(jù)廠商,要盡量讓自己聚焦在創(chuàng)建一個(gè)行業(yè)的解決方案或者是一些應(yīng)用,或者是一些上傳的工具,這樣能夠更好地利用Cloudera非常穩(wěn)定的、成熟的大數(shù)據(jù)平臺(tái),提供整體的解決方案給到客戶(hù)。