將數(shù)據(jù)轉(zhuǎn)化成可視化圖表/形,其實一個工具就能完成,礙于工具太多,按照使用場景,暫且將已成熟應用的分為三個層次:
第一層:數(shù)據(jù)報告、信息圖
這里統(tǒng)稱信息圖。信息圖是把數(shù)據(jù)、信息或知識可視化,必須要有一個清楚準確的解釋或表達甚為復雜且大量的信息。
代表人物是新聞界的David McCandless(大衛(wèi). 麥克坎德雷斯),曾為《英國衛(wèi)報》、《連線》、《獨立報》等刊物撰稿。常以簡潔精美的圖像展現(xiàn)復雜抽象資訊,并將不同的數(shù)據(jù)組合,展現(xiàn)其中的聯(lián)系。他在TED上曾講過:
可視化并不局限于數(shù)字,概念也同樣適用,比如政治傾向圖譜。我試圖將各種政治傾向融入到圖表中,并展示其如何從政府滲透到社會、文化中,對家庭和個人產(chǎn)生影響,繼而又反過來影響政治。
比如用圖形來表示數(shù)值
視線流動,構(gòu)建時空
信息圖的制作:
利用PPT自帶的圖表,可以制作簡潔直觀的數(shù)據(jù)圖表,但附上人文花鳥就需要美工設計;
PS+AI+icon,前期規(guī)劃好表達思路、展示內(nèi)容、所需素材,之后便大刀闊斧動工組件了。圖表的細節(jié),如柱狀圖的長短依據(jù)數(shù)據(jù)大概等比例量一下。
這一類對數(shù)據(jù)的維度數(shù)量要求都不高,運用的大多是結(jié)果數(shù)據(jù),側(cè)重點也在于展示。
第二層:實際數(shù)據(jù)應用
應用類的可視化正如上面所說的,將一堆幾百到即使幾百萬不等的數(shù)據(jù)展示、分析。對于企業(yè),因為這些數(shù)據(jù)本身是自己生產(chǎn)經(jīng)營過程中產(chǎn)生的,能反映歷史的狀況,總結(jié)發(fā)展之道,對目前的問題或者未來下一步的決策起到輔助作用。
這樣的工具excel能解決,報表工具能解決,BI也能解決,具體細化到什么樣的場景不是這里的重點,大家可以在下面評論交流。
通常的制作流程是:導入數(shù)據(jù)(excel)/連接數(shù)據(jù)庫(本地/服務器)——選擇圖表(組合)——設定分析維度——美化展示。比如像這種濃濃的帶有商業(yè)味道的可視化報表(由FineReport制作)
當然,這樣功力的可視化報表需要一定的審美和熟練操作。圖中每一塊都是一個圖表控件,在表單(dashboard)中拖入一個圖表控件,選定數(shù)據(jù)字段,然后搭配組合,排布版型。
第三層:據(jù)挖掘、數(shù)據(jù)連接、關系傳遞
這個可以理解為從海量數(shù)據(jù)中挖掘關系。
大致思路:原始數(shù)據(jù)經(jīng)過一連串收集、提取、清洗、整理等預處理過程,形成高質(zhì)量的數(shù)據(jù)。然后按照需要對數(shù)據(jù)貼標簽分類或者預測,如果要從大量復雜的數(shù)據(jù)中提取有價值且不易發(fā)現(xiàn)的信息還要數(shù)據(jù)建模。(細節(jié)可能各有不同)
比較適用的是一寫高級的數(shù)據(jù)分析挖掘工具以及開源圖表控件,如R,如D3。
用R做可視化,比較容易做出漂亮的可視化圖表,推薦書籍R Graphics Cookbook,書中有150多個recipes,足夠應付大多類型的數(shù)據(jù)。
D3做圖可以定制,美觀圖圖表的豐富性秒殺大多圖表控件,但要求的水平有一丟丟高。
最后,再次引用David McCandless的話“炫酷的可視化對于把思想傳遞給大眾又是至關重要的”,切勿一味追求美感,本末倒置。