
圖2:用樹圖跟蹤查看社交網(wǎng)絡(luò)流媒體服務(wù)的選擇
可視化并非僅僅是靜態(tài)形式,而應(yīng)當(dāng)是互動(dòng)的。交互式可視化可以通過(guò)縮放等方法進(jìn)行細(xì)節(jié)概述。它有如下的步驟:
1、選擇:交互式根據(jù)用戶的興趣選擇數(shù)據(jù)實(shí)體或完整的數(shù)據(jù)集,以及它的子集。
2、鏈接:在多個(gè)視圖找到有用的信息,如圖3所示。
3、過(guò)濾:幫助用戶調(diào)節(jié)顯示的信息量,減少信息數(shù)量并且專注于用戶感興趣的信息。
重排或再映射:空間布局是最重要的視覺(jué)映射,重排信息的空間布局對(duì)產(chǎn)生不同的見解非常有效。
圖3:直方圖(上)和地理圖(底部)的數(shù)據(jù)集之間的互動(dòng)和連接
新的數(shù)據(jù)庫(kù)技術(shù)和前沿的網(wǎng)絡(luò)可視化方法可能是減少成本的重要因素,也有助于完善科研的進(jìn)程。隨著網(wǎng)絡(luò)時(shí)代的到來(lái),數(shù)據(jù)時(shí)時(shí)都在更新,大大減小了可視化的時(shí)效性。這些“低端”可視化通常用于商業(yè)分析和政府?dāng)?shù)據(jù)的開放,但它們對(duì)科研沒(méi)有太大的幫助。許多科學(xué)家使用的可視化工具都不允許連接這些網(wǎng)絡(luò)工具。
三、大數(shù)據(jù)可視化面臨的挑戰(zhàn)
拓展性和動(dòng)態(tài)分析是可視化的兩個(gè)最主要的挑戰(zhàn)。根據(jù)數(shù)據(jù)量的大小,表2顯示了靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)的研究現(xiàn)狀。對(duì)大型動(dòng)態(tài)數(shù)據(jù),原本A問(wèn)題的答案和B問(wèn)題的答案也許在同時(shí)應(yīng)對(duì)AB兩個(gè)問(wèn)題時(shí)就不適用了。
表2:可視化分析的研究現(xiàn)狀和挑戰(zhàn)
基于可視化的方法迎接了四個(gè)“V”的挑戰(zhàn),并將它們轉(zhuǎn)化成以下的機(jī)遇。
體量(Volume):使用數(shù)據(jù)量很大的數(shù)據(jù)集開發(fā),并從大數(shù)據(jù)中獲得意義。
多源(Variety):開發(fā)過(guò)程中需要盡可能多的數(shù)據(jù)源。
高速(Velocity):企業(yè)不用再分批處理數(shù)據(jù),而是可以實(shí)時(shí)處理全部數(shù)據(jù)。
質(zhì)量(Value):不僅為用戶創(chuàng)建有吸引力的信息圖和熱點(diǎn)圖,還能通過(guò)大數(shù)據(jù)獲取意見,創(chuàng)造商業(yè)價(jià)值。
大數(shù)據(jù)可視化的多樣性和異構(gòu)性(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化)是一個(gè)大問(wèn)題。高速是大數(shù)據(jù)分析的要素。在大數(shù)據(jù)中,設(shè)計(jì)一個(gè)新的可視化工具并具有高效的索引并非易事。云計(jì)算和先進(jìn)的圖形用戶界面更有助于發(fā)展大數(shù)據(jù)的擴(kuò)展性。
可視化系統(tǒng)必須與非結(jié)構(gòu)化的數(shù)據(jù)形式(如圖表、表格、文本、樹狀圖還有其他的元數(shù)據(jù)等)相抗衡,而大數(shù)據(jù)通常是以非結(jié)構(gòu)化形式出現(xiàn)的。由于寬帶限制和能源需求,可視化應(yīng)該更貼近數(shù)據(jù),并有效地提取有意義的信息??梢暬浖?yīng)以原位的方式運(yùn)行。由于大數(shù)據(jù)的容量問(wèn)題,大規(guī)模并行化成為可視化過(guò)程的一個(gè)挑戰(zhàn)。而并行可視化算法的難點(diǎn)則是如何將一個(gè)問(wèn)題分解為多個(gè)可同時(shí)運(yùn)行的獨(dú)立的任務(wù)。
高效的數(shù)據(jù)可視化是大數(shù)據(jù)時(shí)代發(fā)展進(jìn)程中關(guān)鍵的一部分。大數(shù)據(jù)的復(fù)雜性和高維度催生了幾種不同的降維方法。然而,他們可能并不總是那么適用。高維可視化越有效,識(shí)別出潛在的模式、相關(guān)性或離群值的概率越高。
大數(shù)據(jù)可視化還有以下幾點(diǎn)問(wèn)題:
視覺(jué)噪聲:在數(shù)據(jù)集中,大多數(shù)對(duì)象之間具有很強(qiáng)的相關(guān)性。用戶無(wú)法把他們分離作為獨(dú)立的對(duì)象來(lái)顯示。
信息丟失:減少可視數(shù)據(jù)集的方法是可行的,但是這會(huì)導(dǎo)致信息的丟失。
大型圖像感知:數(shù)據(jù)可視化不僅受限于設(shè)備的長(zhǎng)寬比和分辨率,也受限于現(xiàn)實(shí)世界的感受。
高速圖像變換:用戶雖然能觀察數(shù)據(jù),卻不能對(duì)數(shù)據(jù)強(qiáng)度變化做出反應(yīng)。
高性能要求:在靜態(tài)可視化幾乎沒(méi)有這個(gè)要求,因?yàn)榭梢暬俣容^低,性能的要求也不高。