10月12日消息,由中國(guó)科學(xué)院計(jì)算技術(shù)研究所主辦,一年一度的Hadoop中國(guó)2011云計(jì)算大會(huì)(Hadoop in China 2011,HiC2011)將于12月2日至3日在北京會(huì)議中心召開(kāi)。大會(huì)將聯(lián)合國(guó)際和國(guó)內(nèi)Hadoop及云計(jì)算技術(shù)應(yīng)用的成功企業(yè),并引入國(guó)際研究界對(duì)于云計(jì)算及DISC(Data Intensive Super Computing)研究方向的學(xué)術(shù)觀點(diǎn)。通過(guò)技術(shù)應(yīng)用和科學(xué)研究雙重視角審視云計(jì)算技術(shù)及Hadoop開(kāi)源生態(tài)系統(tǒng)的現(xiàn)狀和發(fā)展趨勢(shì)。大會(huì)特別邀請(qǐng)了威斯康星大學(xué)、GOOGLE、facebook等眾多專(zhuān)家現(xiàn)場(chǎng)演講交流,部分專(zhuān)家是首次在中國(guó)進(jìn)行交流。
近幾年來(lái),越來(lái)越多的國(guó)內(nèi)外 互聯(lián)網(wǎng)公司和傳統(tǒng)企業(yè)都已意識(shí)到數(shù)據(jù)資產(chǎn)規(guī)?;瘞?lái)的潛在價(jià)值。以Hadoop為代表的大規(guī)模數(shù)據(jù)處理(Big Data Processing)技術(shù)的日趨成熟使得“業(yè)務(wù)為王”向“數(shù)據(jù)為王”轉(zhuǎn)變。如淘寶公司的“數(shù)據(jù)魔方”應(yīng)用,基于全網(wǎng)交易數(shù)據(jù)的分析和挖掘,向用戶提供行 業(yè)動(dòng)態(tài)熱點(diǎn)和市場(chǎng)發(fā)展趨勢(shì)的深度數(shù)據(jù)服務(wù)。大規(guī)模數(shù)據(jù)處理技術(shù)的發(fā)展往往超出想象。拿已有6億用戶的Facebook的為例,大規(guī)模數(shù)據(jù)處理更向著實(shí)時(shí)化 邁進(jìn),其ETL(Extract, Transform, Load)延遲從原來(lái)的24到48小時(shí)演進(jìn)到小于10秒,以滿足在線和實(shí)時(shí)數(shù)據(jù)分析的需求。可以看出“如果性能不滿足需求就是功能缺失”這樣的系統(tǒng)設(shè)計(jì)指 導(dǎo)思想。此外,規(guī)?;臄?shù)據(jù)如果沒(méi)有合適的“掘?qū)毠ぞ?rdquo;是無(wú)法體現(xiàn)其價(jià)值的。信息檢索、內(nèi)容挖掘、自然語(yǔ)言理解、數(shù)據(jù)可視化、計(jì)算廣告學(xué)、地理信息系統(tǒng)等 領(lǐng)域均采用Hadoop技術(shù)研究和開(kāi)發(fā)從數(shù)據(jù)到價(jià)值的各類(lèi)工具,起到了“海量數(shù)據(jù)掘?qū)?rdquo;的作用。
越來(lái)越多的國(guó)內(nèi)外公司參與到Hadoop社區(qū)開(kāi)發(fā),或者直接將線上使用的軟件開(kāi)源。這極大地促進(jìn)了Hadoop技術(shù)在國(guó)內(nèi)的推廣發(fā)展,擴(kuò)大了大規(guī)模數(shù)據(jù)處理的應(yīng) 用范圍。我們欣喜地看到,學(xué)界對(duì)Hadoop的研究熱情不減,今年的VLDB上就出現(xiàn)了數(shù)篇與MapReduce/Hadoop相關(guān)的論文。這說(shuō)明 Hadoop還有很多可完善可改進(jìn)的地方。另一方面,一些商業(yè)軟件也在向Hadoop技術(shù)靠攏,兼容Hadoop軟件棧。同時(shí),國(guó)內(nèi)外出現(xiàn)了一批以提供 Hadoop技術(shù)咨詢(xún)和服務(wù)的公司,Hadoop大規(guī)模數(shù)據(jù)處理技術(shù)的商業(yè)價(jià)值逐漸得到業(yè)界的重視。
Hadoop in China大會(huì)已歷經(jīng)四屆,今年的大會(huì)主題是“海量數(shù)據(jù)掘?qū)?rdquo;。希望以“最細(xì)致的研發(fā)細(xì)節(jié),最直接的交流互動(dòng)”使此次大會(huì)達(dá)到“理解實(shí)際需求。