當然,由于外交決策是一個特殊的領(lǐng)域,它所面對的并非普通大眾,而是社會精英,因此它的數(shù)據(jù)庫與那些面向消費大眾的商業(yè)性數(shù)據(jù)庫還是有差別的。外交決策的數(shù)據(jù)庫不會收集所有民眾的信息,而是收集那些與外交決策相關(guān)的社會精英的數(shù)據(jù)。與小數(shù)據(jù)時代不同的是,在大數(shù)據(jù)時代,關(guān)于社會精英的數(shù)據(jù)不再是隨機樣本,而是以分布式的方法同步建立相關(guān)社會精英的個人數(shù)據(jù)庫,這些個人數(shù)據(jù)庫里將儲存著社會精英的所有信息資料。當這些個人數(shù)據(jù)庫匯集成一個巨大的數(shù)據(jù)網(wǎng)絡(luò)時就變成了大數(shù)據(jù)系統(tǒng)。外交決策大數(shù)據(jù)系統(tǒng)又根據(jù)數(shù)據(jù)分析的方法切割成各具特色的子系統(tǒng),如以收集特定對象所有數(shù)據(jù)為主的靜態(tài)系統(tǒng),或以跟蹤事物發(fā)展動向為主的動態(tài)系統(tǒng)。盡管中國是大國,財力物力和智力資源的基礎(chǔ)十分雄厚,但在選取特定對象時不能面面俱到,而應(yīng)選取最重要、最相關(guān)的對象建立數(shù)據(jù)分析系統(tǒng)。
對中國來說,美國的重要性毋庸置疑,因此可先考慮建立面向美國決策個體的外交決策靜態(tài)數(shù)據(jù)系統(tǒng),以此為樣板,推廣到其他國家。美國外交決策高層一般也就在1000人左右,包括536名國會議員。與對華決策相關(guān)的人員主要由國安會、國務(wù)院和國防部負責亞太事務(wù)的高級官員構(gòu)成,這個名單不會超過100人。對外交決策層來說,了解這些對華決策官員的信息尤為重要。因此,大數(shù)據(jù)系統(tǒng)可從建立這些決策個體的數(shù)據(jù)庫入手,層層切入、逐步完善。在這個決策個體數(shù)據(jù)庫里面,儲存著他們個人所有的數(shù)據(jù),包括家庭、家族和家鄉(xiāng)的背景資料、教育、社交、工作和從政生涯的背景資料,包括價值與利益取向、心理性格特征、健康狀況、思維習(xí)慣、行為特點以及納稅申報狀況的信息數(shù)據(jù)。在信息社會獲取這些數(shù)據(jù)并非難事,基本上可以從公開渠道獲得,如大眾媒體、社交網(wǎng)絡(luò)、學(xué)校醫(yī)院、警察局和法院、圖書檔案館、股票及房地產(chǎn)交易所、工商注冊和選民登記機構(gòu)、通訊公司、商業(yè)網(wǎng)站和公關(guān)公司等。另外可以考慮建立美國對華決策文本數(shù)據(jù)庫,包括歷屆美國總統(tǒng)對華政策及其相關(guān)外交政策的文本;美國國家檔案館解密檔案;歷屆美國國安會與國務(wù)院對華政策文本(為了避免與總統(tǒng)政策文本重疊,主要收集層級較低的數(shù)據(jù));歷屆美國兩黨對華政策的公開辯論與黨內(nèi)文件;美國其他行政部門的對華政策文本。兩大靜態(tài)數(shù)據(jù)系統(tǒng)建立后,在此基礎(chǔ)上建立動態(tài)數(shù)據(jù)庫,追蹤采集決策個體每日的行動蹤影和行為軌跡,包括他會客的對象、接受采訪的談話、參加的重要會議、訪問的地方、撰寫的文章電郵以及批閱的文件等。這些數(shù)據(jù)可以通過機器人從網(wǎng)上抓取,然后經(jīng)過編程自動進入大數(shù)據(jù)系統(tǒng)。各個學(xué)科的專家學(xué)者根據(jù)大數(shù)據(jù)系統(tǒng)的數(shù)據(jù),對這些決策個體進行會診,探究其對華決策的境遇,了解其在對華決策中的作用與立場。
總之,外交決策大數(shù)據(jù)系統(tǒng)建設(shè)應(yīng)該立足于當下,著眼于未來。無論未來信息技術(shù)發(fā)展趨勢如何,數(shù)據(jù)仍然是最重要的基礎(chǔ)。大數(shù)據(jù)技術(shù)如果與其他技術(shù)如人工智能技術(shù)、數(shù)學(xué)建模、模擬技術(shù)、全球定位、地理信息技術(shù)、遙感技術(shù)和傳感技術(shù)等技術(shù)相結(jié)合,定能讓外交決策在新形勢下如虎添翼,效率倍增。大數(shù)據(jù)系統(tǒng)建成之后,以大數(shù)據(jù)為基礎(chǔ)的各種新型決策技術(shù)就有可能實現(xiàn)。如外交決策數(shù)據(jù)的“私人定制”?,F(xiàn)在決策高層定期更換,新上任的領(lǐng)導(dǎo)在長年累月的磨礪中形成了自己的決策風格和知識結(jié)構(gòu),他們中的有些人在外交領(lǐng)域并非是行家。即使是外交部門出身的決策高層,也不可能樣樣精通,總有自己的知識短板。為了讓他們盡快熟知外交決策環(huán)境,以便節(jié)省時間、提高決策效率,可適當運用大數(shù)據(jù)技術(shù)為其量體裁衣,定制外交數(shù)據(jù)。這是一項比較成熟的技術(shù),在信息行業(yè),許多軟件記錄了用戶的個性使用習(xí)慣,便于軟件智能識別,提高運行速度。例如,搜狗輸入可以讓用戶建立個人的打字詞庫,擴大詞匯聯(lián)想;金山快盤可以讓用戶擁有私有云,保存私密性的檔案資料。這些公司的方法很簡單,只要通過電郵注冊個人賬號,計算機軟件就能記錄和辨別用戶的行為習(xí)慣,甚至還會提供智能性的建議。因此,建立在大數(shù)據(jù)基礎(chǔ)上的外交決策智能軟件,猶如為決策高層配備了一個“外事秘書”,它記錄了領(lǐng)導(dǎo)的行為方式,能夠及時彌補領(lǐng)導(dǎo)的專業(yè)知識缺陷,能夠準確無誤地提供外交決策的數(shù)據(jù)尤其是那些常識性的數(shù)據(jù)。隨著使用次數(shù)的增加,這個“外事秘書”越來越熟悉領(lǐng)導(dǎo)的行為方式或思維習(xí)慣,因而有可能提出一些具有高級智能的建議。此外,這個“外事秘書”自身也在不斷學(xué)習(xí),不停地知識更新。它還會與其他機器人“專家學(xué)者”交換信息,補充自己的專業(yè)知識。