中國(guó)IDC圈1月3日?qǐng)?bào)道:當(dāng)你聽(tīng)音樂(lè)時(shí),網(wǎng)站推薦的歌曲居然都是你的“心頭好”;網(wǎng)上購(gòu)物時(shí),總是能從推薦中找到想買(mǎi)的東東;商場(chǎng)門(mén)口的廣告,正是你感興趣的項(xiàng)目;曾經(jīng)很堵的道路,交通導(dǎo)航引導(dǎo)你的總是暢通快捷的道路……
您或許驚喜,生活變得智能變得便利;但是您更加驚奇,到底是什么,改變了您的生活呢?這正是大數(shù)據(jù)的力量~
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
說(shuō)到“數(shù)據(jù)加工”,那么就一定要提提當(dāng)前熱門(mén)的大數(shù)據(jù)處理平臺(tái):Hadoop & Spark。
高效、高容錯(cuò)的分布式文件系統(tǒng)(Hadoop HDFS)、高可靠性、可伸縮的分布式存儲(chǔ)系統(tǒng)(HBase)、基于內(nèi)存的分布式計(jì)算框架(Spark),不斷涌起的開(kāi)源大數(shù)據(jù)技術(shù),推進(jìn)著大數(shù)據(jù)時(shí)代的演進(jìn),給各種企業(yè)帶來(lái)價(jià)值。
【使用運(yùn)維門(mén)檻高,大數(shù)據(jù)“聯(lián)姻”云計(jì)算來(lái)解決】
大數(shù)據(jù)平臺(tái)使用的hadoop&spark這些都是開(kāi)源軟件,開(kāi)源軟件獲取非常方便,但是企業(yè)會(huì)發(fā)現(xiàn)大數(shù)據(jù)開(kāi)源軟件種類(lèi)多,技術(shù)復(fù)雜,對(duì)人員的技能要求很高,大數(shù)據(jù)平臺(tái)的使用和運(yùn)維成難題。而通常的企業(yè)沒(méi)有專(zhuān)門(mén)的大數(shù)據(jù)工程師,這就給企業(yè)實(shí)施大數(shù)據(jù)帶來(lái)了很大的難度。
舉例說(shuō),通常一個(gè)企業(yè)部署一個(gè)簡(jiǎn)單數(shù)據(jù)分析的大數(shù)據(jù)項(xiàng)目,如果自建平臺(tái),一般需要采購(gòu),安裝,部署,運(yùn)維全流程來(lái),至少耗時(shí)幾個(gè)月。而且需要有專(zhuān)門(mén)技能的工程師,這種高門(mén)檻讓普通的企業(yè)很難享受到大數(shù)據(jù)技術(shù)的帶來(lái)的實(shí)惠,所以為了降低使用門(mén)檻,華為將大數(shù)據(jù)服務(wù)化,以云服務(wù)的形式提供企業(yè)以前需要復(fù)雜的物理機(jī)維護(hù)、集群創(chuàng)建、管理、作業(yè)維護(hù)簡(jiǎn)化成幾個(gè)簡(jiǎn)單的web頁(yè)面操作和API調(diào)用,大幅降低客戶(hù)使用大數(shù)據(jù)的門(mén)檻,實(shí)現(xiàn)大數(shù)據(jù)組件的自動(dòng)化部署和運(yùn)維,大幅降低大數(shù)據(jù)的使用門(mén)檻和運(yùn)維成本。
【華為大數(shù)據(jù)平臺(tái),經(jīng)過(guò)考驗(yàn)的平臺(tái),強(qiáng)于社區(qū)又奉獻(xiàn)于社區(qū)】
華為在將大數(shù)據(jù)與云計(jì)算結(jié)合之前,長(zhǎng)期給電信,金融等大企業(yè)提供大數(shù)據(jù)平臺(tái)(Hadoop & Spark),因此華為大數(shù)據(jù)平臺(tái)是經(jīng)過(guò)電信和金融等大企業(yè)嚴(yán)苛考驗(yàn)的平臺(tái)。Hadoop & Spark是開(kāi)源軟件,開(kāi)源軟件在穩(wěn)定性和性能上都有一定的缺失,華為云服務(wù)上部署的Hadoop & Spark是經(jīng)過(guò)數(shù)百個(gè)項(xiàng)目檢驗(yàn)過(guò)的穩(wěn)定可靠的版本。以Spark SQL為例,開(kāi)源的Spark也支持SQL,但是兼容性和能力上都有欠缺。華為在開(kāi)源的基礎(chǔ)上增強(qiáng)Spark SQL能力,華為云服務(wù)的Spark SQL基本支持SQL 99,國(guó)際上通用的TPC-DS測(cè)試100%兼容。除了Spark SQL,華為還在小文件、性能、穩(wěn)定性等很多關(guān)鍵領(lǐng)域里面進(jìn)行了增強(qiáng)。華為大數(shù)據(jù)對(duì)社區(qū)的版本是完全、無(wú)縫兼容,我們對(duì)Hadoop & Spark的增強(qiáng),都積極回饋社區(qū),目前Hadoop 累計(jì)貢獻(xiàn)者20+,貢獻(xiàn)patch 1000+,spark 累計(jì)貢獻(xiàn)者15人+,貢獻(xiàn)patch 200+。
【企業(yè)客戶(hù)降成本、升效率福音:華為企業(yè)云提供彈性大數(shù)據(jù)服務(wù)】
目前,華為企業(yè)云彈性大數(shù)據(jù)服務(wù)已經(jīng)應(yīng)用在金融、教育、能源、智能交通、輿情監(jiān)控等多個(gè)行業(yè)領(lǐng)域:
在金融服務(wù)領(lǐng)域,基于Hadoop的分布式大數(shù)據(jù)平臺(tái),采用分布式算法完成數(shù)據(jù)分析,幫助金融機(jī)構(gòu)更了解客戶(hù)需求和識(shí)別客戶(hù)的資信狀況,通過(guò)對(duì)客戶(hù)刷卡、存取款、電子銀行轉(zhuǎn)帳、存貸款記錄等信息進(jìn)行綜合分析,使原來(lái)2~4周才能處理的貸款審核業(yè)務(wù)周期,具備縮短至小時(shí)級(jí)業(yè)務(wù)處理的能力,極大的提升業(yè)務(wù)處理的效率。
在輿情監(jiān)控領(lǐng)域,彈性大數(shù)據(jù)服務(wù)平臺(tái)在海量數(shù)據(jù)中快速發(fā)現(xiàn)價(jià)值,以大數(shù)據(jù)為支柱的智慧警務(wù)成為警務(wù)發(fā)展的潮流,通過(guò)大量的多類(lèi)型數(shù)據(jù)(從人口統(tǒng)計(jì)數(shù)據(jù)到到各區(qū)域所治安狀況、流動(dòng)人口數(shù)據(jù)等等),創(chuàng)建犯罪高發(fā)地區(qū)熱點(diǎn)圖譜,同時(shí)還將相鄰片區(qū)等各種因素加入到數(shù)據(jù)模型中,并根據(jù)歷史犯罪記錄和地點(diǎn)統(tǒng)計(jì)并不斷修正所得出的預(yù)測(cè)數(shù)據(jù)。實(shí)現(xiàn)更高效的情報(bào)收集,更方便的數(shù)據(jù)共享,更精準(zhǔn)的預(yù)防個(gè)體犯罪行為和反社會(huì)行為,提升了業(yè)務(wù)處理效率。
大數(shù)據(jù)的價(jià)值在很多行業(yè)已經(jīng)充分體現(xiàn):
通過(guò)對(duì)海量、各種類(lèi)型數(shù)據(jù)的分析,幫助企業(yè)的商業(yè)決策更全面,在商業(yè)決策中讓更多的數(shù)據(jù)來(lái)說(shuō)話。
運(yùn)用大數(shù)據(jù),可以改善服務(wù)體驗(yàn)、服務(wù)水平,如互聯(lián)網(wǎng)金融服務(wù)。