石勇
“2001年3月,當我在美國內(nèi)布拉斯加州立大學(xué)任查爾斯—瑪格麗·德姆信息科學(xué)與技術(shù)講習(xí)教授時,曾邀請時任全國人大常委會副委員長、國家自然基金委管理科學(xué)學(xué)部主任成思危先生去該校訪問。”2014年年末的一天,在北京中關(guān)村的一間辦公室里,中科院虛擬經(jīng)濟與數(shù)據(jù)科學(xué)研究中心常務(wù)副主任石勇笑著向《中國科學(xué)報》記者回憶起十三年前的往事。
后來石勇又陪同成思危參觀了著名的信用卡管理與數(shù)據(jù)處理企業(yè)“第一數(shù)據(jù)公司”。當石勇介紹自己及團隊在該公司從事的基于大規(guī)模數(shù)據(jù)的信用風(fēng)險管理建模與分析工作時,成思危對他說:“你應(yīng)該考慮回國工作,這些科研可以促進中國的金融創(chuàng)新。”
彼時,他們的談話間,都還沒有用到十多年后的今天人盡皆知的一個詞—大數(shù)據(jù)。
先人一步
“今天人人皆談大數(shù)據(jù),卻難以想象十年前人們對于這一概念的陌生。”石勇帶著幾分自豪說,“我們可是從十年前就開始從事數(shù)據(jù)科學(xué)研究了。”
2004年秋,在應(yīng)中科院領(lǐng)導(dǎo)之邀回國的石勇的主持下,數(shù)據(jù)挖掘與知識管理中心(籌)在中科院研究生院中關(guān)村校區(qū)正式成立。
在那之前,數(shù)據(jù)挖掘與知識管理這兩個方向在國際上還是分離的,石勇適時地組織了一次學(xué)術(shù)會議,邀請了兩個領(lǐng)域的專家參加,專家們討論后得出共識:要將兩者結(jié)合起來,產(chǎn)生新的創(chuàng)新性科研成果。
考慮到當時公眾的認知,在時任中科院院長路甬祥的建議下,中心的名稱變成了“數(shù)據(jù)技術(shù)與知識經(jīng)濟研究中心(籌)”。
2006年6月,在該中心(籌)發(fā)起組織的一次香山科學(xué)會議上,來自世界各地的知名專家一致認為,數(shù)據(jù)是已知數(shù)據(jù)分析、數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、知識管理、客戶關(guān)系管理等的基礎(chǔ)。數(shù)據(jù)本身具有科學(xué)的含義和規(guī)律,應(yīng)該將數(shù)據(jù)研究作為學(xué)科來對待,研究數(shù)據(jù)科學(xué)(Data Science)。
從此,以數(shù)據(jù)與知識為背景的數(shù)據(jù)科學(xué)逐漸得到眾多領(lǐng)域的認可。
同年9月,受路甬祥的邀請,成思危將其虛擬經(jīng)濟團隊與石勇的團隊進行了重組合并。后來,從日本筑波大學(xué)回國的石敏俊教授也帶領(lǐng)綠色經(jīng)濟團隊加入中心。中心再次改名為“中科院虛擬經(jīng)濟與數(shù)據(jù)科學(xué)研究中心”并延續(xù)至今。
2007年初,中科院正式批準該中心成立。后來,國際上也陸續(xù)成立了有關(guān)數(shù)據(jù)科學(xué)的團隊。“例如,美國哥倫比亞大學(xué)2012年成立數(shù)據(jù)科學(xué)研究所,比我們中心整整晚了5年多。”石勇說。
在海量數(shù)據(jù)里淘到“金子”
領(lǐng)先的當然不僅僅是時間。
這些年來,虛擬經(jīng)濟與數(shù)據(jù)科學(xué)研究中心為國家宏觀經(jīng)濟提供了不少決策依據(jù)。中心名譽主任成思危2009年曾撰文《論人民幣匯率制度改革的下一步—建立靈活的人民幣匯率雙層目標區(qū)》,而后運用虛擬經(jīng)濟理論,寫就《全球金融危機與中國的對策》等報告。在2014年度出版的《人民幣國際化》一書中,成思危提出了10年內(nèi)基本實現(xiàn)人民幣國際化的目標和時間表建議。
該中心也通過扎實的研究為地方建言獻策。石敏俊團隊通過研究,為石羊河流域治理規(guī)劃調(diào)整和完善提出了具體建議。他們還與埃森哲合作創(chuàng)建了埃森哲中科院新資源經(jīng)濟城市指數(shù),為中國城市規(guī)劃與管理提供了一套全新評估分析體系。
科研成果直接面向相關(guān)產(chǎn)業(yè),則是該中心的一大特色。
2006年至2009年,石勇團隊與中國人民銀行征信局和征信中心合作,在全國個人信用數(shù)據(jù)庫基礎(chǔ)上建立了全國個人信用評分系統(tǒng)。這一工作對中國13億人在商業(yè)銀行的日常經(jīng)濟活動有重大影響。截至2010年5月31日,該個人征信系統(tǒng)查詢次數(shù)達6.5億次。該系統(tǒng)年收費20億元,實現(xiàn)了真正意義上的基于大數(shù)據(jù)挖掘的金融工程理論實踐。中國人民銀行前副行長、現(xiàn)中國駐國際貨幣基金組織副總裁朱民贊揚這一居民信用評級“已經(jīng)超過了國際水平”。
目前,石勇團隊獨創(chuàng)的多目標最優(yōu)化數(shù)據(jù)挖掘模型,已成功應(yīng)用于金融、保險、電商等領(lǐng)域的海量數(shù)據(jù)或大數(shù)據(jù)問題,網(wǎng)易、工商銀行、中國經(jīng)融期貨交易所、中國投資公司、中國再保險集團、國家審計署、一號店、商務(wù)部都成為他們的“客戶”。