(2) 多源. 對地觀測大數(shù)據(jù)的多源性, 一方面表現(xiàn)在數(shù)據(jù)來源和獲取手段多樣, 既有來自于分布全球的觀測網(wǎng)絡(luò)實(shí)時接收的大量遙感數(shù)據(jù), 也有通過航空拍攝獲得的遙感數(shù)據(jù), 還包括大眾用戶通過互聯(lián)網(wǎng)和帶有地理信息的手持終端設(shè)備提供的個性化信息. 而且, 主、被動遙感在成像機(jī)理和成像模型等方面也存在巨大的差異.
(3) 多時相. 遙感圖像是某一時刻傳感器對地觀測的記錄, 衛(wèi)星通常按固定的軌道周期對地球進(jìn)行重復(fù)觀測. 單顆衛(wèi)星時間分辨率的提高和在軌衛(wèi)星數(shù)量的不斷增加使得對地觀測的采樣間隔在縮短, 數(shù)據(jù)獲取的頻率大幅度增加. 通過地面?zhèn)鞲芯W(wǎng)等手段獲取數(shù)據(jù)的頻率則更高.
(4) 高價值. 對地觀測數(shù)據(jù)的價值體現(xiàn)在商品價格和應(yīng)用價值兩個方面. 雖然中低分辨率衛(wèi)星數(shù)據(jù)已經(jīng)逐步實(shí)現(xiàn)共享, 但國際上高分辨率衛(wèi)星遙感數(shù)據(jù)的價格仍然不菲, 按數(shù)據(jù)種類的不同, 每平方千米的價格在幾十元到幾百元人民幣不等; 實(shí)際上, 對地觀測數(shù)據(jù)的應(yīng)用價值更為可觀. 對地觀測數(shù)據(jù)不僅在科學(xué)研究、生態(tài)環(huán)境、土地資源、自然災(zāi)害和重大工程的監(jiān)測與評估等方面得到廣泛應(yīng)用, 而且也在數(shù)字地球、智慧城市建設(shè)中發(fā)揮著重要作用, 并逐步深入到大眾生活, 產(chǎn)生了巨大的經(jīng)濟(jì)價值和社會價值.
其他特征:
(1) 異構(gòu). 對地觀測大數(shù)據(jù)的異構(gòu)性
一方面表現(xiàn)為系統(tǒng)異構(gòu), 即數(shù)據(jù)生產(chǎn)所依賴的業(yè)務(wù)應(yīng)用系統(tǒng)存在差異, 如數(shù)據(jù)來自不同的數(shù)據(jù)中心; 另一方面表現(xiàn)為模式異構(gòu), 數(shù)據(jù)的邏輯結(jié)構(gòu)或組織方式不同.
(2) 多尺度. 多尺度是對地觀測大數(shù)據(jù)的重要特征, 這是由于對地觀測系統(tǒng)是由不同級別的子系統(tǒng)組成, 各個系統(tǒng)都有各自的時空尺度, 因而對地觀測大數(shù)據(jù)也具有空間多尺度和時間多尺度的特點(diǎn), 在不同的觀察層次上所遵循的規(guī)律和體現(xiàn)的特征不盡相同.
(3) 非平穩(wěn). 對地觀測大數(shù)據(jù)因?yàn)榫哂袕V泛的獲取方式和物理意義, 因此從信息理論來說是典型的非平穩(wěn)信號, 即分布參數(shù)或者分布規(guī)律隨時間發(fā)生變化, 非平穩(wěn)性正是經(jīng)典遙感數(shù)據(jù)挖掘與分析理論所忽視的.
2.2 對地觀測大數(shù)據(jù)處理面臨“數(shù)據(jù)密集型計(jì)算”問題
對地觀測大數(shù)據(jù)處理是整個對地觀測系統(tǒng)的重要組成部分. 一個全流程的對地觀測數(shù)據(jù)處理過程涉及從數(shù)據(jù)接收和記錄、數(shù)據(jù)傳輸、數(shù)據(jù)預(yù)處理(輻射校正、系統(tǒng)幾何校正)、深加工處理(精校正、正射校正、圖像融合、圖像變換)、數(shù)據(jù)產(chǎn)品存檔與發(fā)布、信息提取與參數(shù)反演、以及專題應(yīng)用(資源環(huán)境調(diào)查、災(zāi)害監(jiān)測、全球變化)等多個環(huán)節(jié). 中國遙感衛(wèi)星地面站目前接收13顆國內(nèi)外衛(wèi)星(表1), 在數(shù)據(jù)接收、記錄與傳輸環(huán)節(jié), 2012年單顆衛(wèi)星的數(shù)據(jù)下傳碼速率高達(dá)320 MB/s, 多顆衛(wèi)星的總碼速率可達(dá)1.5 GB/s; 密云、喀什和三亞各衛(wèi)星接收站每天接收的單顆衛(wèi)星數(shù)據(jù)為10~187.5 GB. 目前, 在數(shù)據(jù)接收、數(shù)據(jù)記錄和數(shù)據(jù)傳輸環(huán)節(jié)具備實(shí)時的數(shù)據(jù)處理能力, 基本能與衛(wèi)星數(shù)據(jù)下傳的碼速率同步. 但是, 據(jù)地面站運(yùn)行處理系統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)顯示, 在預(yù)處理環(huán)節(jié)的整體數(shù)據(jù)處理速度普遍小于2 MB/s, 深加工處理環(huán)節(jié)的數(shù)據(jù)處理速度則小于1 MB/s, 而信息提取及專題遙感應(yīng)用的數(shù)據(jù)處理速率也小于1 MB/s. 因此, 在遙感數(shù)據(jù)預(yù)處理及后續(xù)處理環(huán)節(jié)的數(shù)據(jù)處理速率遠(yuǎn)遠(yuǎn)落后于數(shù)據(jù)接收、記錄與傳輸?shù)乃俾蔥7].
截止到2012年, 3個接收站每天接收的總數(shù)據(jù)量為993.16 GB, 每年接收的總數(shù)據(jù)量約為354 TB. 在傳統(tǒng)的服務(wù)模式中, 衛(wèi)星地面數(shù)據(jù)處理系統(tǒng)常采用訂單任務(wù)方式, 只對少量用戶請求的衛(wèi)星數(shù)據(jù)進(jìn)行處理, 而大部分衛(wèi)星數(shù)據(jù)則直接保存在數(shù)據(jù)存檔系統(tǒng)中. 隨著我國衛(wèi)星接收站網(wǎng)布局的擴(kuò)大以及數(shù)據(jù)中繼衛(wèi)星的發(fā)展, 衛(wèi)星下行數(shù)據(jù)量將大幅提高, 將給對地觀測數(shù)據(jù)處理的全流程帶來巨大的數(shù)據(jù)吞吐壓力, 尤其是對于數(shù)據(jù)處理速率低且相當(dāng)費(fèi)時的深加工、信息提取以及應(yīng)用處理等環(huán)節(jié). 龐大的數(shù)據(jù)吞吐壓力使得這些處理環(huán)節(jié)往往面臨著“數(shù)據(jù)密集型計(jì)算”挑戰(zhàn)性問題[7].
表2給出了對地觀測數(shù)據(jù)處理全流程中各個數(shù)據(jù)處理環(huán)節(jié)算法復(fù)雜度的分析結(jié)果. 從表中可以看出數(shù)據(jù)預(yù)處理算法的復(fù)雜度相對較低, 而后續(xù)的信息提取與參數(shù)反演類算法以及深加工算法的復(fù)雜度相對較高[7].