互聯(lián)網(wǎng)時代,催生了電子商務、數(shù)字化營銷、O2O、P2P這些熱詞。
移動互聯(lián)網(wǎng)時代,互聯(lián)網(wǎng)+、共享經(jīng)濟、云計算、移動互聯(lián)網(wǎng)、虛擬化成了這個時期的標簽
物聯(lián)網(wǎng)時代,大數(shù)據(jù)、Hadoop、非結構化數(shù)據(jù)、Spark、容器、Openstack、萬物互聯(lián)、數(shù)字化轉型、人工智能這些詞匯幾乎成了媒體、廠商、大會等科技圈里無人不提的。
對于今年來說,毫無疑問,人工智能是最火。那么,在人工智能時代,Hadoop是否還有其一席之地?對此,Cloudera作為Hadoop系統(tǒng)的首創(chuàng)者組織,Cloudera大中華區(qū)總經(jīng)理及公司副總裁凌琦迎合站在全球市場的高度,揭示了Cloudera中國區(qū)市場發(fā)展戰(zhàn)略布局以及對技術趨勢的解讀。
2014年12月10日,Cloudera正式進入中國市場。短短兩年多時間,Cloudera已有一個完善的全國布局和客戶基礎。截止目前,其客戶人群主要集中在大型企業(yè),Cloudera內(nèi)部稱為“ Global 8000”??蛻糁饕植荚趲讉€領域:金融(銀行、證券、保險業(yè))、電信以及制造。
在凌琦看來,Cloudera是一個軟件平臺廠商,主要是針對大數(shù)據(jù)、非結構化數(shù)據(jù)的管理,對于機器學習和人工智能的支持。Cloudera會和生態(tài)合作伙伴一起共同為客戶打造更具有價值的解決方案。目前,Cloudera在北京、上海、廣深等地區(qū)結交合作伙伴200余個,專門建立服務于客戶的支持體系,作為7×24小時客戶支持體系的一部分。
談到人工智能和機器學習對Cloudera的影響,凌琦結合Cloudera的產(chǎn)品布局,做了相應解答。
Cloudera在人工智能進化中扮演什么角色?
凌琦認為,人工智能并不是一個新的話題。對比人工智能的進化,主要體現(xiàn)在以下兩方面:第一,計算能力提升了;第二,更重要的是大數(shù)據(jù)的支持。通過機器學習的模型,投入大量的數(shù)據(jù)進行培訓和訓練,最后形成一個在實際的應用環(huán)境當中可以使用的模型。
同時,機器學習也產(chǎn)生了變化。第一是計算成本的降低;第二是整個數(shù)據(jù)量的增加。
毫無疑問,人工智能需要大量的數(shù)據(jù)。數(shù)據(jù)獲取、實時分析處理、數(shù)據(jù)生命周期等方面都需要進行管理。有了這些數(shù)據(jù)之后,數(shù)據(jù)科學家運用各種各樣的分析和人工智能的模型進行機器學習的訓練和模型的驗證,這是一個循環(huán)的過程、不斷在改進的過程。最后,把它應用到生產(chǎn)環(huán)境當中去。
在凌琦看來,應用到生產(chǎn)環(huán)境包括對生產(chǎn)環(huán)境的實時管理和運維,以及通過對生產(chǎn)環(huán)境當中所取得的數(shù)據(jù)的離線分析,再一次豐富數(shù)據(jù)、改變它的模型??凑麄€過程能夠發(fā)現(xiàn),如果僅僅談到人工智能,其實很大程度上是在于機器學習和分析。
對于整個流程,企業(yè)需要很大程度上在數(shù)據(jù)準備以及最后的運營管理部分投入。一個能夠支持機器學習和人工智能的好的平臺,必須要滿足這些功能:各種環(huán)境下的支持,包括公有云和私有云的支持;以及良好的擴展性,即有很好的彈性;成本、以及安全性和運維的支持從這個角度看,Cloudera的數(shù)據(jù)管理平臺,從提供數(shù)據(jù)、到管理數(shù)據(jù)再到清理數(shù)據(jù),實際上Cloudera為人工智能、機器學習提供了一個很好的運營環(huán)境。
除此之外,人工智能對于Cloudera來說,不僅僅是機遇,根據(jù)凌琦的介紹,Cloudera在該方面已經(jīng)全方位布局并取得了進展。
目前,Cloudera的業(yè)務包括三塊:一是以開源為基礎的軟件平臺,稱為CDH;第二,我們的專業(yè)服務;第三,我們的培訓業(yè)務。
Cloudera的核心業(yè)務為軟件業(yè)務,占整體業(yè)務收入的80%有余。Hadoop上的機器學習的平臺,需要管理更大的數(shù)據(jù),能夠在一個完整的平臺上使機器學習充分利用所有的數(shù)據(jù),而不是一個分散的豎井式的數(shù)據(jù)對象。可以看到,現(xiàn)在整個平臺所能夠管理的規(guī)模越來越大,安全性越來越好。
第二,在機器學習上,大量使用新的分布式計算引擎Spark。Spark是現(xiàn)在在機器學習過程當中一個非常重要的計算引擎,當然也還有其他的一些計算引擎。Spark在Hadoop領域里面是最重要的機器學習引擎,在這個部分,Cloudera現(xiàn)在是最大的貢獻者,同時也是最早把Spark引入到整個Hadoop平臺當中,進行全面支持的廠商.