目前,大數(shù)據(jù)已成為全球的熱點(diǎn)話(huà)題。Gartner將大數(shù)據(jù)列為2012年CIO最關(guān)注的技術(shù)方向,IDC也認(rèn)為大數(shù)據(jù)是企業(yè)能力儲(chǔ)備最重要的一個(gè)方面。在近日舉行的2012 Teradata數(shù)據(jù)倉(cāng)庫(kù)暨企業(yè)分析峰會(huì)上,業(yè)界大佬熱議“數(shù)據(jù)金礦”,憧憬大數(shù)據(jù)時(shí)代的美好前景。
中云記者有幸采訪(fǎng)了Teradata天睿公司首席技術(shù)官寶立明(Stephen·Brobst),就Teradata如何應(yīng)對(duì)大數(shù)據(jù)時(shí)代的挑戰(zhàn)、大數(shù)據(jù)發(fā)展現(xiàn)狀和未來(lái)發(fā)展方向燈問(wèn)題做了深入探討。
背景介紹
Teradata天睿公司是全球領(lǐng)先的數(shù)據(jù)倉(cāng)庫(kù)和整合營(yíng)銷(xiāo)管理解決方案供應(yīng)商,專(zhuān)注于數(shù)據(jù)倉(cāng)庫(kù)軟件,數(shù)據(jù)倉(cāng)庫(kù)專(zhuān)用平臺(tái)及企業(yè)分析方案,是全球企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)解決方案領(lǐng)導(dǎo)廠(chǎng)商,是用于世界上最大的商用數(shù)據(jù)庫(kù)的關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng),致力于協(xié)助客戶(hù)制定更明智、更有效的決策,賦予企業(yè)不斷增長(zhǎng)的原動(dòng)力。2010年12月,Teradata斥資5.25億美元收購(gòu)云計(jì)算軟件公司Aprimo,進(jìn)一步拓展云計(jì)算領(lǐng)域,應(yīng)對(duì)IBM和甲骨文等大型廠(chǎng)商的競(jìng)爭(zhēng);2011年3月,Teradata收購(gòu)高級(jí)分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)的市場(chǎng)領(lǐng)導(dǎo)者和開(kāi)拓者Aster Data Systems Inc.。在不到半年的時(shí)間里,Teradata憑借兩次收購(gòu)行為迅速擴(kuò)張了自身的業(yè)務(wù)范圍,瞄準(zhǔn)目前市場(chǎng)最為火熱、最具發(fā)展前景的兩個(gè)領(lǐng)域—云計(jì)算和大數(shù)據(jù)。
兩起收購(gòu)意在應(yīng)對(duì)大數(shù)據(jù)的挑戰(zhàn)
記者:Teradata天睿公司為什么收購(gòu)Aprimo,與下一個(gè)技術(shù)熱點(diǎn)——消費(fèi)智能之間有聯(lián)系嗎?
寶立明:消費(fèi)智能可以吸引更多的消費(fèi)者像公司一樣做出個(gè)人決策,我們可以通過(guò)消費(fèi)智能向消費(fèi)者提供更多的內(nèi)容,讓消費(fèi)者選擇自己所需的產(chǎn)品和服務(wù)?,F(xiàn)在整個(gè)行業(yè)經(jīng)歷從外向市場(chǎng)向內(nèi)向市場(chǎng)的轉(zhuǎn)型,這也是Aprimo公司非常強(qiáng)大的一個(gè)方面,除了收購(gòu)Aprimo公司之外,我們還收購(gòu)了其他一些公司,幫助提供內(nèi)向市場(chǎng)或消費(fèi)智能的功能。
另外Aprimo公司在分析以及整合營(yíng)銷(xiāo)管理方面是一個(gè)領(lǐng)先的解決方案提供商,而Teradata天睿公司在活動(dòng)管理方面也具有非常強(qiáng)大的能力,所以這一收購(gòu)是一次強(qiáng)強(qiáng)聯(lián)合,鞏固了Teradata天睿公司的市場(chǎng)地位,另外更深入的原因是Aprimo公司在軟件即服務(wù)方面也有非常強(qiáng)大的能力。在收購(gòu)Aprimo之后,可以把Teradata天睿公司所有應(yīng)用放在A(yíng)primo的軟件即服務(wù)平臺(tái)上,以更大程度優(yōu)化Teradata天睿公司的能力。
記者:Teradata天睿公司原來(lái)是一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉(cāng)庫(kù)的廠(chǎng)商,現(xiàn)在面向消費(fèi)市場(chǎng),另外Aprimo的整合營(yíng)銷(xiāo)軟件其實(shí)是針對(duì)消費(fèi)類(lèi)的或者與更前端的一些客戶(hù)相關(guān)的,這是不是意味著Teradata天睿公司有一些新的戰(zhàn)略方向,未來(lái)公司的發(fā)展有哪些改變?
寶立明:我認(rèn)為這是公司戰(zhàn)略的一個(gè)演進(jìn)和擴(kuò)展,Teradata天睿公司一直為客戶(hù)提供動(dòng)態(tài)的數(shù)據(jù)倉(cāng)庫(kù)解決方案,現(xiàn)在會(huì)更多的去看整個(gè)價(jià)值鏈上所有相關(guān)人員。
一個(gè)企業(yè)的價(jià)值鏈包含員工、客戶(hù),這些客戶(hù)可能是企業(yè)的具有戰(zhàn)略意義的供應(yīng)商。例如,沃爾瑪這樣的企業(yè)會(huì)擁有很多具有戰(zhàn)略意義的供應(yīng)商,包括寶潔或者聯(lián)合利華這樣的消費(fèi)品公司,沃爾瑪?shù)膯T工也會(huì)需要這些供應(yīng)商的相關(guān)信息或數(shù)據(jù),所以消費(fèi)智能應(yīng)該是未來(lái)的一個(gè)重大概念,消費(fèi)者可能會(huì)訪(fǎng)問(wèn)到某個(gè)公司員工會(huì)用到的一些網(wǎng)站信息和數(shù)據(jù)。
消費(fèi)智能更多的是對(duì)整個(gè)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的一種擴(kuò)展,希望能夠讓智能為所有人或者更多人所使用,而Aprimo所做的數(shù)據(jù)分析在整合營(yíng)銷(xiāo)管理中也會(huì)得到充分的應(yīng)用。從戰(zhàn)略方面可能會(huì)有一些不同的地方,最大的不同之處就是消費(fèi)智能或Aprimo所具備的整合營(yíng)銷(xiāo)管理中強(qiáng)大的數(shù)據(jù)分析能力,是不同于A(yíng)ster Data公司所具備的數(shù)據(jù)發(fā)現(xiàn)平臺(tái)的。Aster Data公司具備一個(gè)強(qiáng)大的數(shù)據(jù)發(fā)現(xiàn)平臺(tái),這個(gè)平臺(tái)更多的為數(shù)據(jù)科學(xué)家所用。
記者:Teradata天睿公司未來(lái)技術(shù)研發(fā)的重點(diǎn)是什么,怎么去平衡結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)分析?
寶立明:Teradata天睿公司關(guān)注各種不同技術(shù)的共同應(yīng)用,幫助企業(yè)用戶(hù)和消費(fèi)者做出更好的決策。過(guò)去Teradata平臺(tái)的數(shù)據(jù)都是關(guān)系型傳統(tǒng)數(shù)據(jù),收購(gòu)Aster Data之后,我們能夠處理非關(guān)系型數(shù)據(jù)。至于大數(shù)據(jù)分析能力,Aster Data公司有自己的文件系統(tǒng),一些編程的變化和體系與原來(lái)的Teradata平臺(tái)是完全不同的,它提供數(shù)據(jù)分析的擴(kuò)展能力,擴(kuò)展到其他不同類(lèi)型的非關(guān)系型數(shù)據(jù)。我們?cè)趯?lái)會(huì)對(duì)Aster Data公司的文件系統(tǒng)建設(shè)和相關(guān)的數(shù)據(jù)分析工具加大投入。
Teradata天睿公司研發(fā)部門(mén)會(huì)加大軟件方面的投入,加大對(duì)圖形或文本的處理方面的研發(fā)力度,除了傳統(tǒng)的技術(shù)之外,一些新的技術(shù)也是我們研發(fā)的重點(diǎn)我覺(jué)得最關(guān)鍵的一點(diǎn)不僅是我們?cè)谘邪l(fā)方面能夠做多少創(chuàng)新,SQL MapReduce這樣的分析工具能夠加快創(chuàng)新速度,使咨詢(xún)?nèi)藛T或客戶(hù)能夠用到更多的分析算法來(lái)解決面臨的問(wèn)題和挑戰(zhàn)。
在實(shí)地所進(jìn)行的開(kāi)發(fā)工作比在實(shí)驗(yàn)室中進(jìn)行的創(chuàng)新或研發(fā)更加重要。
記者:市場(chǎng)上有很多做大數(shù)據(jù)分析的公司,Teradata天睿公司收購(gòu)Aster Data,是因?yàn)榭粗辛薃ster Data在技術(shù)和市場(chǎng)方面哪些獨(dú)特的優(yōu)勢(shì)?
寶立明:現(xiàn)在大數(shù)據(jù)是一個(gè)非常熱的話(huà)題,有很多公司宣稱(chēng)具有大數(shù)據(jù)分析的功能或技術(shù),但其中一些公司可能只是能夠處理大量數(shù)據(jù)而已,而Aster Data公司具備處理多結(jié)構(gòu)數(shù)據(jù)功能,它的文件系統(tǒng)可以改變整個(gè)存儲(chǔ)數(shù)據(jù)的形狀,比如說(shuō)可以把數(shù)據(jù)存在一個(gè)列當(dāng)中,或者把數(shù)據(jù)存在一個(gè)圖形或是一些文本中。
這種文件系統(tǒng)可改變的能力就是Aster Data公司獨(dú)有的,是其他那些所謂有大數(shù)據(jù)分析能力的公司不具備的;此外,Aster Data還具備一個(gè)非常獨(dú)特的分析工具叫做SQL-MapReduce,是一種編程的分析工具,最初在谷歌公司有相關(guān)的應(yīng)用。SQL-MapReduce比Hadoop具備更簡(jiǎn)單易用的功能,可以和它的文件系統(tǒng)綁在一起,以此實(shí)現(xiàn)比Hadoop更高的效率。這也是AsterData的一個(gè)獨(dú)特之處,其編程分析的能力要遠(yuǎn)遠(yuǎn)地高于最初SQL的分析能力,更加簡(jiǎn)單易用。
新技術(shù)不斷出現(xiàn),大數(shù)據(jù)成為市場(chǎng)發(fā)展的一個(gè)趨勢(shì),我們?cè)谑召?gòu)過(guò)程中,也比較了其他一些公司,但是我們發(fā)現(xiàn)他們只是能夠處理大量的數(shù)據(jù),但是Aster Data不同,它不僅考慮到數(shù)據(jù)量的增加、擴(kuò)大,還考慮到數(shù)據(jù)多樣性,具備多樣性數(shù)據(jù)分析的能力,所以這就是我們選擇Aster Data而拒絕其他公司的原因。Teradata天睿公司一直就有處理大量數(shù)據(jù)的能力,現(xiàn)在需要考慮多樣性數(shù)據(jù)。
記者:未來(lái)Teradata跟Aster Data發(fā)展平臺(tái)會(huì)分開(kāi)嗎?
寶立明:Aster Data公司的任務(wù)是要更快地進(jìn)行大數(shù)據(jù)分析方面的技術(shù)創(chuàng)新,Aster Data公司和Teradata天睿公司在技術(shù)和研發(fā)方面有很多相互交流,Teradata天睿公司會(huì)向Aster Data公司提供一些相關(guān)技術(shù)方面的支持,Aster Data有任何技術(shù)創(chuàng)新成就也會(huì)交給Teradata去實(shí)踐和應(yīng)用,但是兩個(gè)公司之間的研發(fā)部門(mén)是完全分開(kāi)的,分開(kāi)的原因是為了更快速地在技術(shù)上實(shí)現(xiàn)一些創(chuàng)新,Aster Data需要能夠非常快速地進(jìn)行大數(shù)據(jù)分析方面的研發(fā)創(chuàng)新,例如剛才提到的文件系統(tǒng)或者一些文本或圖形處理系統(tǒng),如果把兩個(gè)公司的研發(fā)系統(tǒng)綜合在一起做,很大程度上就會(huì)拖緩創(chuàng)新的速度。
但是兩家公司在平臺(tái)上有很強(qiáng)的互通性和互操作性的,也就是說(shuō)Teradata可以看到Aster Data所做的一些工作,反之亦然。在整個(gè)生態(tài)系統(tǒng)中我們可以同步看到這些數(shù)據(jù),這使得數(shù)據(jù)的分析使用變得非常簡(jiǎn)單易用,這個(gè)生態(tài)系統(tǒng)使得我們雙方之間具備很強(qiáng)的互操作性。
記者:如果客戶(hù)既需要分析結(jié)構(gòu)化的數(shù)據(jù),也需要分析非結(jié)構(gòu)化的數(shù)據(jù),那是不是意味著要去分別購(gòu)買(mǎi)Teradata和Aster Data的產(chǎn)品呢?
寶立明:這是兩種不同的技術(shù),是分隔開(kāi)來(lái)的技術(shù),但是本身又具備互操作性,Teradata天睿公司具備處理結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的能力,如果你需要大數(shù)據(jù)分析的能力你可以去Aster公司購(gòu)買(mǎi),但如果需要傳統(tǒng)的關(guān)系型數(shù)據(jù)分析能力,你也可以來(lái)Teradata天睿公司購(gòu)買(mǎi)。兩者是整合在一起的,如果兩者都需要你就可以從我們這里獲得兩種,也可以分開(kāi)來(lái)獲得,即可以從Aster Data獲得大數(shù)據(jù)的分析能力,從Teradata獲得關(guān)系型數(shù)據(jù)分析能力。
記者:Aster Data的優(yōu)勢(shì)在于SQL-MapReduce這個(gè)技術(shù),但是中國(guó)客戶(hù)更喜歡開(kāi)源的軟件,這樣是否是一個(gè)矛盾?
寶立明:這兩者之間的確有一個(gè)灰色區(qū)域存在,但是要看如何平衡。兩個(gè)平臺(tái)在效率、復(fù)雜性方面各有千秋,SQL-MapReduce分析工具以人們已經(jīng)熟悉的SQL作為基礎(chǔ),所以產(chǎn)生價(jià)值的時(shí)間應(yīng)該更快一些。而Hadoop需要先寫(xiě)程序才能得出最終的數(shù)據(jù)分析價(jià)值,所以相較于SQL-MapReduce,它產(chǎn)生價(jià)值的時(shí)間稍慢一些,其間企業(yè)可能丟失其它一些發(fā)展機(jī)會(huì)。但Hadoop是一個(gè)免費(fèi)軟件,可以下載,所以費(fèi)用上會(huì)有優(yōu)勢(shì),所以在產(chǎn)生價(jià)值的時(shí)間和費(fèi)用問(wèn)題上企業(yè)需要做出權(quán)衡、取舍。
當(dāng)然,有時(shí)所謂的免費(fèi)不一定是完全免費(fèi),比如當(dāng)你要用Hadoop時(shí),用到的服務(wù)器可能會(huì)是SQL-MapReduce所用服務(wù)器的十倍,軟件本身免費(fèi),但是服務(wù)器不免費(fèi);另外服務(wù)器所消耗的電力和占地面積都需要花錢(qián),如在加州地區(qū),你需要交三年的電費(fèi),可以免費(fèi)把服務(wù)器送給你。這時(shí)要考慮總擁有成本的問(wèn)題,而不單是看這個(gè)軟件許可證的費(fèi)用。
此前,Teradata一直致力于提供企業(yè)級(jí)數(shù)據(jù)庫(kù)的關(guān)系數(shù)據(jù)庫(kù)的管理系統(tǒng),但隨著物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)及云計(jì)算的發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),個(gè)人消費(fèi)者也更加關(guān)注數(shù)據(jù),如何掘金非結(jié)構(gòu)化數(shù)據(jù),并將自身業(yè)務(wù)拓展至個(gè)人消費(fèi)者領(lǐng)域成為T(mén)eradata需要解決的問(wèn)題。通過(guò)收購(gòu)Aprimo和Aster Data這兩家分別在個(gè)人消費(fèi)市場(chǎng)整合營(yíng)銷(xiāo)領(lǐng)域和非結(jié)構(gòu)化數(shù)據(jù)分析領(lǐng)域領(lǐng)先的公司,Teradata不僅很好的解決了面臨的問(wèn)題,而且拓展了自身的業(yè)務(wù)范圍,為將來(lái)占據(jù)更大的市場(chǎng)份額打下了良好的基礎(chǔ)。
中國(guó)“大數(shù)據(jù)”的發(fā)展現(xiàn)狀和問(wèn)題
記者:目前看來(lái),大數(shù)據(jù)現(xiàn)在還是處于概念火熱期,您認(rèn)為業(yè)務(wù)爆發(fā)增長(zhǎng)期在什么時(shí)候?
寶立明:我認(rèn)為很多公司已經(jīng)在真正意義上去實(shí)施大數(shù)據(jù)分析了,只是在中國(guó)可能人們更多的把大數(shù)據(jù)當(dāng)作一個(gè)概念性的東西,認(rèn)為它仍然處在一個(gè)探索階段。上兩周我見(jiàn)過(guò)很多人,和他們談到大數(shù)據(jù)在中國(guó)的發(fā)展,他們對(duì)大數(shù)據(jù)非常感興趣。Teradata天睿公司希望能夠大規(guī)模地把大數(shù)據(jù)分析能力和技術(shù)引入中國(guó)市場(chǎng),而且我們要尋求一些突破,使大數(shù)據(jù)的分析最終成為一個(gè)主流技術(shù)。
對(duì)很多客戶(hù)來(lái)說(shuō),他們購(gòu)買(mǎi)大數(shù)據(jù)的技術(shù)或分析能力,是希望解決自己所面臨的問(wèn)題。過(guò)去可能需要做一些相應(yīng)的編程工作,才能夠看到問(wèn)題所在,現(xiàn)在A(yíng)ster Data公司的SQL-MapReduce分析工具能夠幫助客戶(hù)很快地解決問(wèn)題,所以很多互聯(lián)網(wǎng)公司都愿意使用。這些公司中的一些人過(guò)去對(duì)SQL工具非常熟知,使用過(guò)SQL進(jìn)行數(shù)據(jù)分析,現(xiàn)在SQL-MapReduce和SQL有很多相似之處,非常了解SQL的人在使用SQL-MapReduce時(shí)會(huì)很輕松。
記者:中美兩國(guó)在市場(chǎng)環(huán)境發(fā)展?fàn)顩r的很多方面都是不一樣的,您認(rèn)為在中國(guó)推廣大數(shù)據(jù)產(chǎn)品業(yè)務(wù)會(huì)遇到什么困難?
寶立明:中國(guó)市場(chǎng)是一個(gè)規(guī)模很大的市場(chǎng),中國(guó)一個(gè)很小的銀行可能相當(dāng)于美國(guó)最大的銀行,這對(duì)于Teradata天睿公司來(lái)說(shuō)是一個(gè)很好的機(jī)會(huì)。Teradata天睿公司一直都非常關(guān)注自己的解決方案所具備的可伸展性,這是收購(gòu)Aster Data一個(gè)很重要的原因,Aster Data提供的解決方案具備很強(qiáng)的可伸展性。另外,中國(guó)市場(chǎng)消費(fèi)者對(duì)于價(jià)格非常敏感,人們需要處理海量數(shù)據(jù)——大數(shù)據(jù)的技術(shù),但是又不想花太多的錢(qián),在中國(guó)市場(chǎng)上人們分析每個(gè)字節(jié)的數(shù)據(jù)愿意花費(fèi)的價(jià)錢(qián)遠(yuǎn)遠(yuǎn)低于在美國(guó)人們?cè)敢鉃槊總€(gè)字節(jié)花費(fèi)的價(jià)錢(qián),所以如果我們具備很強(qiáng)的數(shù)據(jù)壓縮能力,能夠在經(jīng)濟(jì)性方面帶來(lái)很大益處。
Aster Data也引入了很強(qiáng)的數(shù)據(jù)壓縮能力,在經(jīng)濟(jì)性方面是一個(gè)很好的選擇。另外在中國(guó)市場(chǎng)上人們更喜歡使用免費(fèi)軟件,或者說(shuō)開(kāi)源軟件,像Hadoop這樣的一些分析工具就具備開(kāi)源的能力,這是非常符合中國(guó)市場(chǎng)的需求的。Aster Data和Teradata,在開(kāi)源工具或分析能力和解決方案的提供方面也會(huì)進(jìn)行更多的投入,這對(duì)于把大數(shù)據(jù)解決方案引入中國(guó)非常重要。
中國(guó)和美國(guó)市場(chǎng)的不同在于要解決的問(wèn)題不同,在美國(guó)市場(chǎng)上更多的要解決優(yōu)化問(wèn)題,因?yàn)槊绹?guó)市場(chǎng)是一個(gè)成熟的市場(chǎng),引入解決方案要能夠幫助這些客戶(hù)節(jié)約更多資金或創(chuàng)造更多利潤(rùn);但中國(guó)市場(chǎng)則要解決促進(jìn)增長(zhǎng)的問(wèn)題,怎么獲取更多的客戶(hù),怎么利用現(xiàn)有客戶(hù)創(chuàng)造更多的收入。
云計(jì)算的發(fā)展為“掘金”大數(shù)據(jù)提供了非常有利的基礎(chǔ)條件和必要工具。中國(guó)市場(chǎng)的“大規(guī)模”特性也為大數(shù)據(jù)分析技術(shù)的提出了發(fā)展需求,同時(shí)國(guó)內(nèi)外企業(yè)都看到了中國(guó)市場(chǎng)在大數(shù)據(jù)分析領(lǐng)域蘊(yùn)藏的巨大潛力,紛紛通過(guò)各種方式搶占市場(chǎng)先機(jī)。但由于中國(guó)市場(chǎng)上的消費(fèi)者有著其自身的特性,很多外來(lái)企業(yè)短期內(nèi)并不能完全洞察這些特性,或者即使看到這些特性,也不會(huì)迅速的“因地制宜”,這為國(guó)內(nèi)廠(chǎng)商提供了極其有利的搶占市場(chǎng)先機(jī)的機(jī)會(huì)。