中國工程院院士李國杰
“其實(shí),生物信息學(xué)、腦科學(xué)、空間科學(xué)等基礎(chǔ)研究早就采用數(shù)以PB級(jí)計(jì)的大數(shù)據(jù),卻沒能引發(fā)大數(shù)據(jù)浪潮。大數(shù)據(jù)如今引起各方重視,主要還是因?yàn)樗N(yùn)藏著巨大的經(jīng)濟(jì)價(jià)值。”
近日,在北京召開的“大數(shù)據(jù)背景下的計(jì)算機(jī)和經(jīng)濟(jì)發(fā)展高層論壇”上,中國工程院院士李國杰表示,我國開展大數(shù)據(jù)研究,一定要以企業(yè)為主體,充分調(diào)動(dòng)企業(yè)和經(jīng)濟(jì)界學(xué)者的積極性。
大數(shù)據(jù)在經(jīng)濟(jì)領(lǐng)域應(yīng)用的一個(gè)有趣案例,是通過社交網(wǎng)絡(luò)預(yù)測股價(jià)漲落。社交媒體監(jiān)測平臺(tái)DataSift監(jiān)測了社交網(wǎng)站Facebook首次公開募股當(dāng)天Twitter上的情感傾向與Facebook股價(jià)波動(dòng)的關(guān)聯(lián)。在Facebook開盤前,Twitter上的情感逐漸轉(zhuǎn)向負(fù)面,25分鐘之后,F(xiàn)acebook股價(jià)便開始下跌。而當(dāng)Twitter上的情感轉(zhuǎn)向正面時(shí),F(xiàn)acebook股價(jià)在8分鐘之后也開始了回彈。最終當(dāng)股市接近收盤、Twitter上的情感轉(zhuǎn)向負(fù)面時(shí),10分鐘后Facebook的股價(jià)又開始下跌。該機(jī)構(gòu)得出最終的結(jié)論是:Twitter上每一次情感傾向的轉(zhuǎn)向都會(huì)影響Facebook股價(jià)的波動(dòng)。
“預(yù)測股價(jià),是公認(rèn)的很難做到的事,但大數(shù)據(jù)分析也能發(fā)揮作用。”李國杰說,“其他過去認(rèn)為做不到的事情,也許大數(shù)據(jù)分析都能派上用場。因此,我們的當(dāng)務(wù)之急是多實(shí)踐,實(shí)踐出知識(shí),實(shí)踐出理論。只有當(dāng)每個(gè)領(lǐng)域的數(shù)據(jù)分析做得相當(dāng)深入時(shí),才能提出數(shù)據(jù)科學(xué)的共性問題。”
雖然大多數(shù)單位其實(shí)仍處于“小數(shù)據(jù)”處理階段,但李國杰認(rèn)為,企業(yè)和政府部門都不必太在意自己正在分析的是不是“大數(shù)據(jù)”,更不必花精力對(duì)各種名詞和定義作無謂爭論。“只要在縱向上有一定的時(shí)間積累,在橫向上有較豐富的記錄細(xì)節(jié),通過多個(gè)源頭對(duì)同一個(gè)對(duì)象采集的各種數(shù)據(jù)有機(jī)整合,進(jìn)行認(rèn)真仔細(xì)的數(shù)據(jù)分析,就可能產(chǎn)生大價(jià)值。”
李國杰還提醒,要對(duì)我國在大數(shù)據(jù)方面的技術(shù)基礎(chǔ)落后有清醒認(rèn)識(shí)。由于我國人口最多,網(wǎng)民也最多,許多人估計(jì)我國每年新數(shù)據(jù)的增量應(yīng)該在世界上名列前茅。但僅就數(shù)據(jù)量而言,我國還不是數(shù)據(jù)大國。根據(jù)麥肯錫公司的報(bào)告,2010年美國新增數(shù)據(jù)量為3500PB,歐洲為2000PB,中國僅為250PB。也就是說,我國每年新增數(shù)據(jù)量僅為美國的7%、歐洲的12%。
“當(dāng)然,大數(shù)據(jù)的關(guān)鍵并不在數(shù)據(jù)量的大小,而在于獲取有效信息的能力和數(shù)據(jù)分析能力的高低。”李國杰說,“但在大數(shù)據(jù)領(lǐng)域,我國與世界先進(jìn)國家也不在同一條起跑線上。”
現(xiàn)在涉及大數(shù)據(jù)的會(huì)議很多,但李國杰覺得政府、企業(yè)和學(xué)術(shù)界未必真正理解大數(shù)據(jù)的重大意義。“許多人對(duì)變革性技術(shù)的效益估計(jì)往往是,近期過于樂觀,遠(yuǎn)期估計(jì)不足。”
他自己的判斷是,如同云計(jì)算、物聯(lián)網(wǎng)一樣,近幾年內(nèi)大數(shù)據(jù)的市場規(guī)模不會(huì)很大,全世界大概只有數(shù)百億美元。但是,大數(shù)據(jù)市場的增速將是傳統(tǒng)IT產(chǎn)業(yè)的好幾倍。“對(duì)近期的大數(shù)據(jù)市場不能估計(jì)過高,不能自己忽悠自己。開展大數(shù)據(jù)研究和應(yīng)用一定要有長遠(yuǎn)眼光。”