圖 2. 時(shí)空數(shù)據(jù)預(yù)測流程圖 參考資源

Step1:準(zhǔn)備時(shí)空預(yù)測輸入數(shù)據(jù)
想要獲得未來時(shí)間的目標(biāo)預(yù)測值,首先需要有和時(shí)空數(shù)據(jù)建模的輸入數(shù)據(jù)結(jié)構(gòu)統(tǒng)一的未來時(shí)刻的自變量數(shù)據(jù)。未來時(shí)刻的自變量數(shù)據(jù)可以保持已知的最終數(shù)據(jù)不變,或者是人為修改過的用于假設(shè)分析的數(shù)據(jù)。
Step2:構(gòu)建空間協(xié)方差矩陣來捕捉預(yù)測地理位置和初始地理位置之間的空間相關(guān)性
預(yù)測數(shù)據(jù)中的地理位置和初始數(shù)據(jù)中的地理位置可以不同,也可以預(yù)測數(shù)據(jù)中一些地理位置和初始地理位置相同,或者預(yù)測地理位置是初始地理位置的子集。
Step3:對初始位置的回歸殘差進(jìn)行空間插值得到預(yù)測的地理位置
利用第 2 步構(gòu)建的空間協(xié)方差矩陣對初始地理位置經(jīng)過轉(zhuǎn)換后的回歸殘差進(jìn)行插補(bǔ),從而得到預(yù)測的地理位置。
Step4:預(yù)測未來時(shí)間的線性回歸殘差
預(yù)測未來時(shí)間的回歸殘差是在時(shí)間點(diǎn) m+1, m+2, ... m+H 上逐步迭代進(jìn)行, 其中, m 是建模的最終時(shí)間點(diǎn),H 是需要預(yù)測的未來時(shí)間點(diǎn)的個數(shù)。
Step5:計(jì)算未來時(shí)間點(diǎn)的目標(biāo)值
未來時(shí)間點(diǎn)的目標(biāo)值需要通過回歸模型,第 4 步中計(jì)算得到的時(shí)間點(diǎn) m+1, m+2, ... m+H 上的回歸殘差和在未來時(shí)間點(diǎn)和新的地理位置上的預(yù)測輸入數(shù)據(jù)值來計(jì)算。
Step6:計(jì)算未來時(shí)間點(diǎn)目標(biāo)值的置信區(qū)間
基于高斯過程和已知模型每一部分的方差情況,可逐級推出最終預(yù)測目標(biāo)值的置信區(qū)間。此步驟過于復(fù)雜,本文不作詳述。
Step7:預(yù)測結(jié)果輸出
最終得到的預(yù)測結(jié)果包括在未來時(shí)間指定位置的目標(biāo)值,以及預(yù)測值置信區(qū)間的上下限。
時(shí)空預(yù)測應(yīng)用實(shí)例
在充分了解時(shí)空數(shù)據(jù)建模及預(yù)測理論結(jié)構(gòu)的基礎(chǔ)上,我們來描述該時(shí)空預(yù)測模型在 IBM SPSS Modeler 中的具體實(shí)現(xiàn),并結(jié)合應(yīng)用實(shí)例展示如何應(yīng)用時(shí)空數(shù)據(jù)模型的假設(shè)情況分析(what-if 分析)實(shí)現(xiàn)對未來任何時(shí)間任何地點(diǎn)目標(biāo)值的準(zhǔn)確預(yù)測。
時(shí)空預(yù)測模型描述
在 IBM SPSS Modeler 中,時(shí)空預(yù)測模型分析使用包含位置數(shù)據(jù)、預(yù)測輸入字段(預(yù)測變量)、時(shí)間字段和目標(biāo)字段的數(shù)據(jù),如圖 3 中時(shí)空預(yù)測模型字段選項(xiàng)的參數(shù)所示。 時(shí)空預(yù)測模型的輸入數(shù)據(jù)必須是經(jīng)過時(shí)空數(shù)據(jù)預(yù)處理,融合了時(shí)間序列和形狀數(shù)據(jù),同時(shí)包含時(shí)間變量,空間位置變量及其他相關(guān)變量的數(shù)據(jù)。在該數(shù)據(jù)中,每個位置在數(shù)據(jù)中都有許多行,這些行表示每個預(yù)測變量在每個測量時(shí)間的值。 分析數(shù)據(jù)后,可以使用該數(shù)據(jù)來預(yù)測所使用的形狀數(shù)據(jù)(.shp 文件)內(nèi)任意位置處的目標(biāo)值。 并且,還可以預(yù)測何時(shí)能夠獲知未來時(shí)間點(diǎn)的輸入數(shù)據(jù)。
圖 3.時(shí)空預(yù)測模型-字段選項(xiàng)

這里,目標(biāo)字段是將要預(yù)測的目標(biāo)變量。位置字段是一個測量級別為"地理空間"的字段,可以是點(diǎn)、線、多邊形(面)、多點(diǎn)、多線、多面等位置類型。形狀數(shù)據(jù)通常包含一個表明層特征的名稱的字段,例如,這可能是省/自治區(qū)/直轄市或者國家或地區(qū)的名稱。 使用此字段可以將名稱或標(biāo)簽與位置相關(guān)聯(lián),方法是選擇一個分類字段來標(biāo)注輸出中的所選位置字段,即位置標(biāo)簽字段。時(shí)間字段是要在預(yù)測中使用的時(shí)間變量,只能選擇測量級別為"連續(xù)"且存儲類型為時(shí)間、日期、時(shí)間戳記或整數(shù)的字段。預(yù)測變量是預(yù)測輸入字段,只能選擇測量級別為"連續(xù)"的字段。
設(shè)置好時(shí)空預(yù)測模型所需的變量后,我們就該考慮時(shí)空預(yù)測模型的構(gòu)建了。在 IBM SPSS Modeler 中,時(shí)空預(yù)測模型的構(gòu)建選項(xiàng)還分為時(shí)間間隔、基本、高級和輸出等子項(xiàng),分別實(shí)現(xiàn)時(shí)空數(shù)據(jù)建模中的不同功能。
在可以構(gòu)建時(shí)空預(yù)測模型之前,需要進(jìn)行數(shù)據(jù)準(zhǔn)備以便將時(shí)間字段轉(zhuǎn)換為索引;要使得能夠進(jìn)行這種轉(zhuǎn)換,時(shí)間字段中的記錄之間必須有固定的區(qū)間。如果數(shù)據(jù)尚未包含此信息,我們就可以使用"時(shí)間間隔"子項(xiàng)中的選項(xiàng)來設(shè)置此區(qū)間,然后才能進(jìn)行時(shí)空數(shù)據(jù)建模。"時(shí)間間隔"選項(xiàng)如圖 4 所示。
圖 4. 時(shí)空預(yù)測模型-時(shí)間間隔選項(xiàng)
