企業(yè)對大數(shù)據(jù)的需求
走向了廣泛部署以后,現(xiàn)在的企業(yè)需要的是什么樣的大數(shù)據(jù),企業(yè)需要是大數(shù)據(jù)平臺,有三類企業(yè)。
第一類是大客戶,是跨國的公司。 他給我的關(guān)鍵詞是第一我需要大數(shù)據(jù)平臺要可持續(xù),一定要平臺的可持續(xù),要能保證三到五年甚至十年的持續(xù)供應(yīng),不能跟我合作一兩年以后你這個公司不存在??沙掷m(xù)對大客戶非常重要,因為心里技術(shù)變化非???,社區(qū)開源新技術(shù)變化非???,客戶的消化能力也非常限,客戶的主業(yè)不在技術(shù),可持續(xù)是非常重要。另外一個是云化,一個是內(nèi)部的云化,為什么,因為大客戶內(nèi)部有很多部門,上百部門都需要數(shù)據(jù)分析來做支撐,如果你的數(shù)據(jù)平臺是煙囪式的不能做云化,內(nèi)部做服務(wù)化的支撐,內(nèi)部云化的混合化的提供,對他負擔非常重。
第二個是國內(nèi)零售的銀行。 跟他們CTO講的時候,他講原來的數(shù)據(jù)確實是煙囪式的,每個子系統(tǒng)都有整個的系統(tǒng),在12年開始采用華為公司的產(chǎn)品,在各條業(yè)務(wù)線已經(jīng)開展了很多的大數(shù)據(jù)集群,從去年華為就把20多個大數(shù)據(jù)匯集到統(tǒng)一的平面,形成了第二經(jīng)營平面,大數(shù)據(jù)已經(jīng)作為經(jīng)營平面支撐企業(yè)日常分析活動。
第三是中小企業(yè)。 技術(shù)變化這么快,新技術(shù)處在混戰(zhàn)的實地,這些中小企業(yè)的主業(yè),這個能源公司主要是搞能源,不是搞技術(shù),每天風機在轉(zhuǎn),風機轉(zhuǎn)跟天氣的關(guān)系是什么關(guān)系,如何做到提前預測,這種公司難道搭建一個大數(shù)據(jù)平臺嗎?不可能,IT人員可能一兩個人,這種客戶迫切需要的是大數(shù)據(jù)云服務(wù),大數(shù)據(jù)云服務(wù)對中小企業(yè)來說也是非常重要的。
面向業(yè)務(wù)創(chuàng)新的大數(shù)據(jù)平臺
未來第一階段從傳統(tǒng)的收倉交易為中心,第二是數(shù)據(jù)為中心,第三階段是以人為中心的全渠道數(shù)據(jù)的整合,這個時候非常重要的一個標志就是數(shù)據(jù)處理和云服務(wù)的結(jié)合,跨地域。這個架構(gòu)多樣化的引擎,現(xiàn)在社區(qū)有很多的技術(shù),你的平臺框架能否引入新的引擎來處理不同的場景,因為現(xiàn)在不是一個引擎包大天下的時代,未來引擎的多樣化和大數(shù)據(jù)云服務(wù)非常重要,這是華為FusionInsight大數(shù)據(jù)平臺,簡單來說最底層有兩個產(chǎn)品,一個是ITD,做一個統(tǒng)一入口,讓客戶不用關(guān)心數(shù)據(jù)在哪里,可以做一個全量全局的查詢,上面這一層非常重要,因為Hadoop1.0(階段)是給開發(fā)者用,2.0(階段)是期望給分析師用,明年開始大數(shù)據(jù)的數(shù)據(jù)分析一定走入業(yè)務(wù)人員,他是沒有辦法看到底層這么復雜的技術(shù),他需要是做交互式探索的,大數(shù)據(jù)不是做定量的分析,是做關(guān)聯(lián)分析,就是在不斷的探索過程當中發(fā)現(xiàn)數(shù)據(jù)的價值,不斷的修整和反饋,我們提供這個產(chǎn)品能做全量數(shù)據(jù)的探索,就是沒有模式,沒有西格瑪,可以自動識別出有哪些模式供你選擇,你不需要很多搜索條件,給你提供很多自動的(英語)的識別,這是非常重要的。
另外提供一個Farmer的產(chǎn)品,這個產(chǎn)品非常重要,因為客戶關(guān)鍵應(yīng)用,比如征信、審計類的實時應(yīng)用,跟Hadoop有距離,不能直接用,需要在Hadoop托管之上使用的平臺,包括能處理事件和流的決策平臺,這個平臺架構(gòu)在Hadoop之上,客戶只需要關(guān)心自己的應(yīng)用邏輯,在上面寫邏輯就可以了,華為的Farmer已經(jīng)完成了數(shù)據(jù)位置到服務(wù)的管理,同時也做實時決策的分析,比如你要關(guān)心我需要什么樣的客戶,我推薦什么樣的商品,這個邏輯就會運算到下面的大數(shù)據(jù)平臺,這是華為這一層的產(chǎn)品。
從開源的重要性再談一下,華為持續(xù)回饋開源社區(qū),從09年開始在Hadoop、Spark社區(qū)辛勤的耕耘,華為在兩個社區(qū)都是排名第四,Spark排名在上升,很重要的幾個標志事件,是今年6月份我們獲得了國內(nèi)首張Spark的 商用發(fā)行版認證,而Spark的圖算法,華為在社區(qū)里有核心的貢獻,今年11月份,PrefixSpan算法發(fā)布。
最后看一下案例,華為的大數(shù)據(jù)平臺分兩個交互模式,一個是線上,一個是線下,線下主要跟企業(yè)客戶提供大數(shù)據(jù)平臺,跟合作伙伴來開發(fā)應(yīng)用,一起為支撐客戶的應(yīng)用創(chuàng)新。
第一個是招商銀行信用卡的案例,從周到分鐘,之前客戶發(fā)信用卡以周為單位,申請以后需要做很多要素的審核,你的消費習慣,你有沒有上黑名單,你的風險承受能力,你的信貸情況,其中有很多環(huán)節(jié)是要人工參與的,采用華為大數(shù)據(jù)平臺,以后發(fā)卡周期變成以分鐘為單位,當場就可以發(fā)卡,華為的平臺給他提供了一條非常容易的多條規(guī)則并行的計算,給客戶提供非常真實的征信情況,當時可以發(fā)臨時卡,這是一個變化。