可感知的交互的擴展性也是大數(shù)據(jù)可視化面臨的挑戰(zhàn)??梢暬總€數(shù)據(jù)點都可能導致過度繪制而降低用戶的辨識能力,通過抽樣或過濾數(shù)據(jù)可以刪去離群值。查詢大規(guī)模數(shù)據(jù)庫的數(shù)據(jù)可能導致高延遲,降低交互速率。
在大數(shù)據(jù)的應用程序中,大規(guī)模數(shù)據(jù)和高維度數(shù)據(jù)會使進行數(shù)據(jù)可視化變得困難。當前大多數(shù)大數(shù)據(jù)可視化工具在擴展性、功能和響應時間上表現(xiàn)非常糟糕??梢暬治鲞^程中,不確定性是有效的考慮不確定性的可視化過程巨大挑戰(zhàn)。
可視化和大數(shù)據(jù)面臨許多的挑戰(zhàn),下面是一些可能的解決方法:
1. 滿足高速需要:一是改善硬件,可以嘗試增加內(nèi)存和提高并行處理的能力。二是許多機器會用到的,將數(shù)據(jù)存儲好并使用網(wǎng)格計算方法。
2. 了解數(shù)據(jù):請合適的專業(yè)領域人士解讀數(shù)據(jù)。
3. 訪問數(shù)據(jù)質(zhì)量:通過數(shù)據(jù)治理或信息管理確保干凈的數(shù)據(jù)十分必要。
4. 顯示有意義的結(jié)果:將數(shù)據(jù)聚集起來到一個更高層的視圖,在這里小型數(shù)據(jù)組和數(shù)據(jù)可以被有效地可視化。
5. 處理離群值:將數(shù)據(jù)中的離群值剔除或為離群值創(chuàng)建一個單獨的圖表。
四、大數(shù)據(jù)可視化的一些進展
在大數(shù)據(jù)時代,可視化操作究竟是如何進行的呢?首先可視化會為用戶提供一個總的概覽,再通過縮放和篩選,為人們提供其所需的更深入的細節(jié)信息。可視化的過程在幫助人們利用大數(shù)據(jù)獲取較為完整的客戶信息時起到了關鍵性作用。而錯綜的關系是眾多大數(shù)據(jù)場景中的重要一環(huán),社交網(wǎng)絡或許就是最顯著的例子,想要通過文本或表格的形式理解其中的大數(shù)據(jù)信息是非常困難的;相反,可視化卻能夠?qū)⑦@些網(wǎng)絡的趨勢和固有模式展現(xiàn)地更為清晰。在形象體現(xiàn)社交網(wǎng)絡用戶之間的關系時,通常使用的是基于云計算的可視化方法。通過相關性模型來描繪社交網(wǎng)絡中用戶節(jié)點的層次關系,這種方法能夠直觀地展示用戶的社會關系。此外,它還能借助利用云技術的海杜普軟件平臺(Hadoop)將可視化過程并行化,從而加快社交網(wǎng)絡的大數(shù)據(jù)收集。
大數(shù)據(jù)可視化可以通過多種方法來實現(xiàn),比如多角度展示數(shù)據(jù)、聚焦大量數(shù)據(jù)中的動態(tài)變化,以及篩選信息(包括動態(tài)問詢篩選,星圖展示,和緊密耦合)等等。以下一些可視化方法是按照不同的數(shù)據(jù)類型(大規(guī)模體數(shù)據(jù)、變化數(shù)據(jù)和動態(tài)數(shù)據(jù))來進行分析和分類的:
樹狀圖式:基于分層數(shù)據(jù)的空間填充可視化方法。
圓形填充式:樹狀圖式的直接替代。它使用圓形作為原始形狀,并能從更高級的分層結(jié)構(gòu)中引入更多的圓形。
旭日型:在樹狀圖可視化基礎上轉(zhuǎn)換到極坐標系統(tǒng)。其中的可變參量由寬和高變成半徑和弧長。
平行坐標式:通過可視化分析,將不同帝鄉(xiāng)的多重數(shù)據(jù)因素拓展開來。
蒸汽圖式:堆疊區(qū)域圖的一種,數(shù)據(jù)圍繞一條中軸線展開,并伴隨流動及有機形態(tài)。
循環(huán)網(wǎng)絡圖式:數(shù)據(jù)圍繞一個圓形排列,并按照它們自身的相關性比率由曲線相互連接。通常用不同的線寬或色彩飽和度測量數(shù)據(jù)對象的相關性。
表格3:可視化工具概覽
表格4:可視化工具的區(qū)分
傳統(tǒng)的數(shù)據(jù)可視化工具不足以被用來處理大數(shù)據(jù)。以下列舉了幾種將交互式大數(shù)據(jù)可視化的方法。首先,利用一個由可擴展的直觀數(shù)據(jù)摘要群組成的設計空間可以將多種類型的變化數(shù)據(jù)可視化,這些直觀的數(shù)據(jù)摘要通過數(shù)據(jù)簡化(如聚合或抽樣)的方法得出。被應用于特定區(qū)間的交互查詢方法(比如關聯(lián)和更新技術)因此通過結(jié)合多元數(shù)據(jù)塊和并行查詢而被開發(fā)出來。而更先進的方法被運用在一個基于瀏覽器的視覺分析系統(tǒng)——imMens上,來處理數(shù)據(jù)以及對GPU(圖像處理器)進行渲染。