“中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟”推出“大數(shù)據(jù)100分”論壇,晚上9點(diǎn)開始,于“中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟”微信群進(jìn)行時(shí)長100分鐘的交流、探討。
白碩:擔(dān)任今天主講的是中科院計(jì)算所程學(xué)旗研究員,大家歡迎!
白碩:現(xiàn)任中國科學(xué)院計(jì)算技術(shù)研究所副總工、研究員、博士生導(dǎo)師、網(wǎng)絡(luò)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室主任。
作為中科院計(jì)算所互聯(lián)網(wǎng)高性能軟件與算法理論、網(wǎng)絡(luò)搜索、網(wǎng)絡(luò)信息安全方向的團(tuán)隊(duì)負(fù)責(zé)人和學(xué)科帶頭人,帶領(lǐng)團(tuán)隊(duì)從事國家網(wǎng)絡(luò)空間安全保障、互聯(lián)網(wǎng)高性能軟件以及網(wǎng)絡(luò)搜索與挖掘基礎(chǔ)理論與算法的研究以及相關(guān)應(yīng)用系統(tǒng)的研發(fā),先后主持并完成了十多項(xiàng)國家信息安全重大專項(xiàng)、國家重大基礎(chǔ)研究計(jì)劃(973)、國家高技術(shù)研究計(jì)劃(863)以及中國科學(xué)院知識創(chuàng)新工程等重大任務(wù)。
程學(xué)旗:首先,謝謝白老師主持,謝謝國棟為大家創(chuàng)造了一個(gè)很好的環(huán)境,我們可以在此頭腦風(fēng)暴、分享觀點(diǎn)。其次,前天和昨天白老師和熊輝教授的引導(dǎo)性發(fā)言立意新穎、觀點(diǎn)鮮明,讓我受益匪淺啊。
程學(xué)旗:上周國棟讓我從國內(nèi)學(xué)術(shù)科研界的視角來分享一下我們的思考。從能力上來講確實(shí)有點(diǎn)勉為其難,只能拋磚引玉。
程學(xué)旗:大家知道,自從我們2012年開始組織香山科學(xué)會議大數(shù)據(jù)論壇、組建中國計(jì)算機(jī)學(xué)會大數(shù)據(jù)專家委員會以來,一直努力在倡導(dǎo)和呼吁聯(lián)合各方力量來推動中國大數(shù)據(jù)產(chǎn)學(xué)研良性生態(tài)環(huán)境建設(shè),今天群里面的很多大腕都是直接的倡導(dǎo)者和參與者。
程學(xué)旗:一年多來,通過組織中國大數(shù)據(jù)技術(shù)大會、CCF大數(shù)據(jù)學(xué)術(shù)會議以及各類大大小小的應(yīng)用峰會與學(xué)術(shù)論壇,結(jié)合我們科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室所承擔(dān)的與大數(shù)據(jù)相關(guān)的重大基礎(chǔ)課題研究以及與情報(bào)分析、互聯(lián)網(wǎng)數(shù)據(jù)分析相關(guān)的應(yīng)用開發(fā)實(shí)踐,我談?wù)勛约旱囊恍┧伎肌?/p>
程學(xué)旗:今天引導(dǎo)性討論的內(nèi)容可以包括三大塊,包括:對大數(shù)據(jù)的再認(rèn)識、引擎平臺系統(tǒng)支撐下的大數(shù)據(jù)分析技術(shù)、建立大數(shù)據(jù)產(chǎn)學(xué)研生態(tài)環(huán)境的基礎(chǔ)性問題思考。
白碩:引擎平臺系統(tǒng),單數(shù)還是復(fù)數(shù)?
程學(xué)旗:應(yīng)該是單數(shù),呵呵
@雷濤:程所給大家搭了大平臺和產(chǎn)業(yè)話筒。
程學(xué)旗:1、關(guān)于大數(shù)據(jù)的再認(rèn)識。
大數(shù)據(jù)是一個(gè)寬泛的概念,見仁見智。關(guān)于大數(shù)據(jù)的概念,當(dāng)前比較普遍使用的定義都與維基百科中的描述類似:“大數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊”。而這類定義的一個(gè)明顯的局限是僅僅從大數(shù)據(jù)的計(jì)算機(jī)處理視角給出的關(guān)于大數(shù)據(jù)的一個(gè)特點(diǎn)描述。
我們知道,對一門學(xué)科的認(rèn)識,往往是從分類開始的。就像達(dá)爾文提出進(jìn)化論,原始的動機(jī)就是將從全世界觀察到的動物和植物進(jìn)行劃分,形成體系。在分類體系上進(jìn)行提煉,最終形成了一個(gè)全新的世界觀和認(rèn)識論。我們現(xiàn)在所關(guān)注的網(wǎng)絡(luò)大數(shù)據(jù)、金融大數(shù)據(jù)、科學(xué)大數(shù)據(jù)等相關(guān)領(lǐng)域的問題,正像歐洲文藝復(fù)興開始的的時(shí)候那樣,從不同領(lǐng)域觀察現(xiàn)象,挖掘價(jià)值,而最終我們可能能夠發(fā)現(xiàn)本質(zhì),形成全新的“數(shù)據(jù)認(rèn)識論”,從而產(chǎn)生本質(zhì)性的價(jià)值效應(yīng)。
我個(gè)人認(rèn)為,“大數(shù)據(jù)”更多的體現(xiàn)的是一個(gè)認(rèn)知和思維,它與錢學(xué)森先生提倡的“大成智慧學(xué)”的要義非常接近。錢老將“大成智慧”翻譯成“WisdominCyberspace”,強(qiáng)調(diào)“必集大成,才能得智慧”。大數(shù)據(jù)從內(nèi)涵來看的四個(gè)V的特性,體現(xiàn)出來的是大量的“零金碎玉”,相互之間還有關(guān)聯(lián)性和作用力,但是局部看都非常零散、價(jià)值不明顯。所以有了數(shù)據(jù),不等于就有價(jià)值、出智慧,出智慧的關(guān)鍵在“集”。大數(shù)據(jù)中包括的全部事實(shí)、經(jīng)驗(yàn)、信息都是“集”的對象和內(nèi)容。采集到的原始數(shù)據(jù)往往是些沒有什么邏輯,不一定能直接用現(xiàn)在掌握的科學(xué)技術(shù)解釋,需要集成融合各個(gè)側(cè)面的數(shù)據(jù),才能挖掘出前人未知的大價(jià)值。每一種數(shù)據(jù)來源都有一定的局限性和片面性,事物的本質(zhì)和規(guī)律隱藏在各種原始數(shù)據(jù)的相互關(guān)聯(lián)之中。只有融合、集成各方面的原始數(shù)據(jù),才能反映事物的全貌。開展大數(shù)據(jù)研究和應(yīng)用,因此,大數(shù)據(jù)不僅僅是一類資源、一類工具,而是一種戰(zhàn)略、認(rèn)知和文化,要大力推廣和樹立“數(shù)據(jù)方法論”、“數(shù)據(jù)價(jià)值觀”。