科學(xué)遇到大數(shù)據(jù),帶來哪些挑戰(zhàn)?清華大學(xué)肖田元教授認(rèn)為,大數(shù)據(jù)可分為兩大類:來自科學(xué)實(shí)驗(yàn)與工程的大數(shù)據(jù)和來自互聯(lián)網(wǎng)的人類社會(huì)活動(dòng)大數(shù)據(jù)。對(duì)于第一類的大數(shù)據(jù)的挑戰(zhàn),仿真范式采取“以大化小”,在還原論的指導(dǎo)下,基于已知小世界的規(guī)律,建立與運(yùn)行模型,以發(fā)現(xiàn)有組織的更大更復(fù)雜的系統(tǒng)的因果規(guī)律。現(xiàn)在,日本等許多國家已經(jīng)實(shí)現(xiàn)科學(xué)數(shù)據(jù)密集型運(yùn)用,包括生命與醫(yī)療、粒子物理、天氣預(yù)報(bào)、基因?qū)W、地震預(yù)報(bào)。而面對(duì)來自互聯(lián)網(wǎng)的社會(huì)活動(dòng)大數(shù)據(jù),新型應(yīng)用將致力于為實(shí)際的決策提供信息,最終目的是幫助科學(xué)家、研究人員、決策者及社會(huì)大眾做出有充分信息依據(jù)的決定。用傳統(tǒng)IT技術(shù)和軟硬件工具無法在可容忍的時(shí)間內(nèi)對(duì)其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。這就對(duì)傳統(tǒng)科研范式提出了挑戰(zhàn),需要考察大數(shù)據(jù)時(shí)代科學(xué)研究的未來,探索支持科學(xué)研究新范式。仿真范式難以解決無組織的大世界的問題,數(shù)據(jù)密集方法基于統(tǒng)計(jì)分析可從整體上研究大世界的相關(guān)性。大數(shù)據(jù)時(shí)代數(shù)據(jù)密集型科學(xué)范式是面向大世界,無需定義邊界,無需規(guī)定規(guī)模,只受限于數(shù)據(jù),無需模型,不受還原論約束。作為一種整體論的解決方法,可不受時(shí)間、空間尺度影響,由數(shù)據(jù)發(fā)現(xiàn)涌現(xiàn)性、演化機(jī)制,適應(yīng)開放復(fù)雜大系統(tǒng)的要求?;跀?shù)據(jù)及其關(guān)聯(lián)網(wǎng)絡(luò)形成的數(shù)據(jù)界,通過“機(jī)器學(xué)習(xí)”、數(shù)據(jù)挖掘,發(fā)現(xiàn)這些節(jié)點(diǎn)和鏈接的關(guān)聯(lián),從而獲得整體的知識(shí)。通過“眾包研究模式”使大規(guī)??茖W(xué)研究成為可能,如Google“流感趨勢(shì)”項(xiàng)目、地球引擎項(xiàng)目。肖田元教授認(rèn)為,需要發(fā)展仿真范式,與數(shù)據(jù)密集型方法相融合,實(shí)現(xiàn)密集計(jì)算與密集數(shù)據(jù)的集成,以實(shí)現(xiàn)無組織的復(fù)雜的系統(tǒng)的因果規(guī)律的發(fā)現(xiàn)。