近日,由中國電子學(xué)會主辦,中國電子學(xué)會云計(jì)算專家委員會和中國云計(jì)算技術(shù)與產(chǎn)業(yè)聯(lián)盟承辦的“云計(jì)算與大數(shù)據(jù)”專題研討會在北京京西賓館隆重召開。中國電子學(xué)會名譽(yù)理事長、原信息產(chǎn)業(yè)部吳基傳部長,以及工業(yè)和信息化部周子學(xué)總經(jīng)濟(jì)師先后致辭,對中國電子學(xué)會精準(zhǔn)把握新一代信息技術(shù)發(fā)展特征表示肯定,對召開大數(shù)據(jù)方向具有前瞻性、基礎(chǔ)性的研討會表示祝賀。出席本次研討會的領(lǐng)導(dǎo)和嘉賓還有:工業(yè)和信息化部軟件與服務(wù)業(yè)司陳偉司長、李未院士、李德毅院士、倪光南院士、中國電子學(xué)會副理事長劉汝林、中國電子學(xué)會秘書長徐曉蘭、中國電子學(xué)會副秘書長林潤華以及中國電子學(xué)會云計(jì)算專家委員會和中國云計(jì)算技術(shù)與產(chǎn)業(yè)聯(lián)盟的專家代表共50余人。
研討會由中國電子學(xué)會云計(jì)算專家委員會主任委員李德毅院士主持,李未院士、李德毅院士、百度公司技術(shù)委員會理事長陳尚義博士、中科院計(jì)算所何清研究員、中國移動通信研究院錢嶺研究員、北京友友天宇系統(tǒng)技術(shù)有限公司總經(jīng)理姚宏宇博士分別就云計(jì)算與大數(shù)據(jù)話題發(fā)表了精彩的主題演講。
“四面體模型實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)管理”
在李未院士看來,軟件產(chǎn)業(yè)面臨了三次浪潮,第一是結(jié)構(gòu)化數(shù)據(jù)+算法,其主要基礎(chǔ)軟件是操作系統(tǒng)如Windows與數(shù)據(jù)庫;第二是半結(jié)構(gòu)化數(shù)據(jù)+搜索,形成了諸多搜索引擎如百度、Google還有電子商務(wù)如亞馬遜;第三是非結(jié)構(gòu)化數(shù)據(jù)服務(wù)+即時服務(wù),代表是非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)和集成的各種服務(wù)。
大數(shù)據(jù)時代,數(shù)據(jù)模型變得更為重要,增加了智能化處理、關(guān)聯(lián)化檢索以及知識挖掘等數(shù)據(jù)模型要實(shí)現(xiàn)深度提取和共享,需要新的改變。李未院士帶領(lǐng)團(tuán)隊(duì)自2009年開始,特別研發(fā)了高級非結(jié)構(gòu)化數(shù)據(jù)——四面體模型,以統(tǒng)一數(shù)據(jù)模型為突破口,結(jié)合文本圖象,圖形、音頻、視頻的特性實(shí)現(xiàn)新型非結(jié)構(gòu)化數(shù)據(jù)的管理系統(tǒng)。
李未院士指出,未來90%的數(shù)據(jù)將是非結(jié)構(gòu)化數(shù)據(jù),而且增長迅猛,針對非結(jié)構(gòu)化數(shù)據(jù)建立新型數(shù)據(jù)模型是非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)的關(guān)鍵,李未院士提出四面體模型(即基本屬性刻面、語義特征刻面、底層特征刻面、原始數(shù)據(jù)刻面),四面體模型具有完備、關(guān)聯(lián)、集成、可擴(kuò)展等特性,易于實(shí)現(xiàn)對超量的非結(jié)構(gòu)化數(shù)據(jù)創(chuàng)建、維護(hù)與管理,可以成為非結(jié)構(gòu)化數(shù)據(jù)模型的標(biāo)準(zhǔn),必須使用群體軟件工程的理念和技術(shù)來生成、管理和維護(hù)非結(jié)構(gòu)化數(shù)據(jù)。四面體模型已經(jīng)在500萬個非機(jī)構(gòu)化樣例中得到了廣泛測試,未來還將進(jìn)一步從傳感器開始,更多地通過群體軟件來完善非結(jié)構(gòu)化數(shù)據(jù)中的四面體。
“寬帶不寬制約大數(shù)據(jù)發(fā)展”
李德毅院士:寬帶不寬依然是制約云計(jì)算與大數(shù)據(jù)發(fā)展的瓶頸
在第四屆中國云計(jì)算大會上,李德毅院士曾明確指出“寬帶不寬”制約了云計(jì)算的發(fā)展。如今面對大數(shù)據(jù),李德毅院士仍然表示:“互聯(lián)網(wǎng)和云計(jì)算是大數(shù)據(jù)產(chǎn)生的基礎(chǔ),寬帶不寬依然是制約云計(jì)算與大數(shù)據(jù)發(fā)展的瓶頸。”
圍繞“什么是大數(shù)據(jù),如何處理大數(shù)據(jù)”,李德毅院士列舉了數(shù)據(jù)具有低密度價值的特征,需求特點(diǎn)是用戶驅(qū)動型,并著重以位置云服務(wù)為例,說明目前大數(shù)據(jù)在行業(yè)中的應(yīng)用現(xiàn)狀。而通過科學(xué)發(fā)展與目前大數(shù)據(jù)技術(shù)的關(guān)聯(lián),以及大數(shù)據(jù)發(fā)展中存在的技術(shù)限制,李德毅院士表示:“現(xiàn)在不一定先有科學(xué)后又技術(shù),很可能是技術(shù)中有科學(xué),科學(xué)中有技術(shù)。大數(shù)據(jù)時代的科學(xué)價值(正在一步步體現(xiàn))。”
“大數(shù)據(jù)帶來產(chǎn)業(yè)變革”
陳尚義博士從百度大數(shù)據(jù)特征入手,分析了大數(shù)據(jù)帶來的技術(shù)和產(chǎn)業(yè)變革,認(rèn)為目前數(shù)據(jù)規(guī)模及增長速度超越了處理能力,在數(shù)據(jù)智能成為現(xiàn)實(shí)的同時也引發(fā)新的安全危機(jī),改變了學(xué)術(shù)研究和技術(shù)革新的思路,而且創(chuàng)新模式發(fā)生了根本改變。
何清研究員從大數(shù)據(jù)的演化、數(shù)據(jù)挖掘發(fā)展歷程、大數(shù)據(jù)挖掘云服務(wù)實(shí)踐三個方面指出大數(shù)據(jù)挖掘算法往往是高復(fù)雜度甚至是NP難題,需要盡量把全局最優(yōu)問題轉(zhuǎn)化成局部最優(yōu)的問題,需要采用高效并行策略等。錢嶺研究員回顧了大數(shù)據(jù)處理技術(shù)發(fā)展概況,指出電信運(yùn)營商對大數(shù)據(jù)的需求點(diǎn),最后通過大云2.0闡述了中國移動在大數(shù)據(jù)應(yīng)用實(shí)踐方面的創(chuàng)新。姚宏宇博士分析大用戶特征在于增長爆發(fā)性、使用突發(fā)性、需求易變性、關(guān)聯(lián)網(wǎng)絡(luò)效應(yīng);大數(shù)據(jù)特征在于數(shù)據(jù)量(Volume)、數(shù)據(jù)多樣性(Variety)、數(shù)據(jù)吞吐量(Velocity)、數(shù)據(jù)內(nèi)容(Value);大系統(tǒng)特征在于系統(tǒng)高可用性、管理壓力與維護(hù)成本、性能線性延展、需求多樣性等,并對大用戶、大數(shù)據(jù)、大系統(tǒng)所面臨的機(jī)遇與挑戰(zhàn)進(jìn)行了詳盡的闡述。與會嘉賓紛紛對云計(jì)算與大數(shù)據(jù)技術(shù)、商業(yè)模式及未來的融合創(chuàng)新趨勢展開了熱烈的討論。
大數(shù)據(jù)正影響著企業(yè)商業(yè)模式的轉(zhuǎn)變,對大數(shù)據(jù)進(jìn)行處理、分析及整合正成為提升企業(yè)核心競爭力的有效方式。2012年3月,美國政府更是撥款2億美元啟動“大數(shù)據(jù)研究和發(fā)展倡議”計(jì)劃。本次研討會正是在此背景下,邀請國家相關(guān)部委主管領(lǐng)導(dǎo)、云計(jì)算及大數(shù)據(jù)領(lǐng)域的著名院士專家,針對云計(jì)算與大數(shù)據(jù)等重要問題進(jìn)行探討研究,為推動國內(nèi)大數(shù)據(jù)技術(shù)發(fā)展與產(chǎn)業(yè)變革做出積極探索。