結合空間的時間序列預測
結合空間的時間序列預測是從時間的角度來考慮時空數(shù)據(jù)。與傳統(tǒng)的時間序列不同的是,與空間有關的時間序列彼此不是獨立的,而是和空間相關的。例如,可以首先構造時間序列模型以獲取每個獨立空間區(qū)域的時間特性,然后構造神經(jīng)網(wǎng)絡模型擬合隱含的空間相關性,最后基于統(tǒng)計回歸結合時間和空間預測獲得綜合預測。
時空預測的理論框架
如上所述,時空預測根據(jù)時空對象的不同有不同的分類方法,本文我們重點介紹 IBM SPSS Modeler 中對于包含時間和空間兩種屬性的數(shù)據(jù)的建模與預測。其提供了一個綜合時間和空間屬性的有效的手段,充分利用各種數(shù)據(jù)序列的特征,將時間、空間及時空自回歸預測方法有效地結合,并在預測同時考慮了研究對象之間的空間影響關系,從而提高了預測的精確度。
時空數(shù)據(jù)建模
時空預測模型實質上是一個基于線性回歸的擴展模型,其原理可以用如下公式表示:
其中, 系數(shù)β是自變量的系數(shù),表示自變量對于目標變量的影響程度;Z作為線性擬合的殘差,是目標變量變化中用自變量線性組合無法表示的部分,可用來在自回歸(Autoregressive,AR)模型中捕捉時間自相關性,進而用于描述空間的相關性。我們可以通過圖 1 所示的流程圖來具體討論這一過程。
圖 1. 時空數(shù)據(jù)建模流程圖

Job0:準備工作
針對時空建模的復雜性,適當?shù)臄?shù)據(jù)驗證和缺失值篩選將有助于模型的構建。通過檢測,包含缺失值或無效值百分比較高的一些樣本位置將從分析中刪除,而缺失值或無效值百分比較低的樣本位置則被留下來,后期建模過程中將對其進行特殊編碼處理,以盡可能多保留數(shù)據(jù)信息。
Job1:擬合線性回歸模型
回歸模型采用標準的線性回歸模型(包括或不包括截距),但由于數(shù)據(jù)的時空相關關系,其殘差會形成一個零均值的非獨立的時空相關隨機過程。線性回歸的系數(shù),可衡量自變量對目標變量的影響程度,較大的系數(shù)對應的自變量表明其單位變化會產生較大的目標變量變化。
Job2:擬合時間自回歸模型
自回歸模型使用指定的自回歸階數(shù),即指定之前若干個時刻的值來預測當前值。自回歸的系數(shù)可用與衡量過往時刻的殘差對當前值的影響。自回歸模型同樣包含殘差,由于其中的時間自相關因素已被移除,自回歸模型的殘差在時間上是相互獨立的。
Job3:計算時間自回歸模型殘差并建立空間協(xié)方差模型
基于地理空間的協(xié)方差模型建立在時間自回歸模型殘差的基礎上,空間協(xié)方差模型有兩種實現(xiàn)方法:參數(shù)法和非參數(shù)法。參數(shù)法具有更精簡的數(shù)學表達式和更好的模型推廣能力,所以在假設所給數(shù)據(jù)能夠進行參數(shù)化建模的情況下,提供了兩個參數(shù)檢驗方法來確定模型的準確性。其一是檢測是否空間中存在隨著距離而變化的衰減,其二檢測空間方差在給定區(qū)域具有普遍性(方差同質性檢驗)。如果不滿足參數(shù)化模型的假設,將會構造非參數(shù)化的模型,利用空間殘差所形成空間關系矩陣來描述數(shù)據(jù)中的空間關系。
Job4:修正時間自回歸模型
空間協(xié)方差量化表達了數(shù)據(jù)的空間關系,從而可以從之前線性回歸的殘差中移除空間關系的影響,進而能夠修正時間自回歸模型,更新自回歸模型的參數(shù),獲得更加準確的時間自回歸關系的描述。
Job5:修正線性回歸模型
基于準確 的空間關系和時間自相關關系的描述,可從原始的數(shù)據(jù)中去除時間和空間關系的影響,從而能夠修正線性回歸模型的參數(shù),更加準確的描述出自變量對目標變量的影響。
Job6:計算測定后的統(tǒng)計值并保存結果
上述步驟已經(jīng)完成了模型的估計過程,獲得的模型可生成目標變量的估計值,與觀測值相比較,能夠評價所建模型的質量。同時通過一些參數(shù)檢驗的方法,可以評價自變量,時間自回歸系數(shù)的重要性等一些基于模型的評價指標。
時空數(shù)據(jù)預測
時空數(shù)據(jù)預測是基于時空數(shù)據(jù)模型的一個假設情況分析(what-if 分析),可以預測未來一段時間在分析范圍中任何地理位置的目標值。我們可以通過圖 2 所示的流程圖來具體討論這一過程。