中國IDC圈2月26日報(bào)道:在一個(gè)不斷釋放出新概念的技術(shù)世界,大概從2012年到2015年,作為一個(gè)術(shù)語,“大數(shù)據(jù)”的炒作周期已實(shí)屬漫長,人們迫不及待地將它漸次比喻為新時(shí)代的石油,金礦和土壤——盡管不同于石油,金礦和土壤,也不同于可穿戴設(shè)備,虛擬現(xiàn)實(shí)等同樣擁有旺盛新鮮度技術(shù)的目力所及,以數(shù)據(jù)庫和后臺分析為根基的大數(shù)據(jù)多數(shù)時(shí)候化于無形,無法讓人輕易觸碰。所以在不少人看來,對大數(shù)據(jù)概念的熱炒已經(jīng)進(jìn)入尾聲,從現(xiàn)在開始,作為商業(yè)基礎(chǔ)設(shè)施的數(shù)據(jù)分析將逐步迎來一個(gè)擲地有聲的落地階段。
大體而言,大數(shù)據(jù)的落地有兩片最肥沃的土壤:第一是可被輕易體察的2C市場,無論電商還是社交,阿里和騰訊以數(shù)據(jù)為利器對于個(gè)體中心化的追求即是最好的例子;第二是航空,能源,制造,電信,快消等垂直行業(yè),而相比于洞察個(gè)體的輕巧與迅捷,數(shù)據(jù)價(jià)值在行業(yè)中的落地?zé)o疑要相對沉穩(wěn)——畢竟,理解一個(gè)擁有無數(shù)細(xì)碎分工的行業(yè)總要比理解一個(gè)具體的消費(fèi)者困難些,也正因如此,沉穩(wěn)之后的爆發(fā)才尤為可期。
而談及大數(shù)據(jù)與行業(yè)的嫁接,全球四大會計(jì)師事務(wù)所之一的安永與海云數(shù)據(jù)的聯(lián)姻則頗具樣本意義。去年底,兩家體量不同卻因數(shù)據(jù)結(jié)緣的公司簽訂的全球戰(zhàn)略合作協(xié)議曾在大數(shù)據(jù)業(yè)界引發(fā)熱議,就在不久前,后者研發(fā)的航空大數(shù)據(jù)可視化產(chǎn)品DIVA正式投入商用,它是海云與安永合作后推出的首款行業(yè)級應(yīng)用產(chǎn)品。透過于此,你會看到當(dāng)一個(gè)行業(yè)的數(shù)據(jù)——或者說行業(yè)的知識被可視化之后,會化繁為簡,產(chǎn)生邏輯,產(chǎn)生意義,從而產(chǎn)生價(jià)值。
在更大的意義上,如果說大數(shù)據(jù)是以“上帝視角”還原這個(gè)世界,那么數(shù)據(jù)可視化則稱得上是“上帝的指紋”。
行業(yè)痛點(diǎn)
任何一款產(chǎn)品都從解決行業(yè)痛點(diǎn)開始,通常來說,大數(shù)據(jù)在落地過程中要遭遇三個(gè)問題。
首先是數(shù)據(jù)體量過大且種類繁雜。目前現(xiàn)存數(shù)據(jù)中,75%都是所謂非結(jié)構(gòu)化數(shù)據(jù),包括各種文本,語音,圖像,視頻,社交關(guān)系,空間軌跡等,它們異構(gòu)且分別獨(dú)立,如一座座信息孤島般難以協(xié)同工作。而處理和匯總這些多維信息的最好載體無疑是可視化,一個(gè)最淺顯不過的道理是——人類是視覺動物。
嗯,人類層累式進(jìn)化而來的大腦更偏愛擁有畫面感的信息。右腦對于圖像的記憶速度要比左腦記憶抽象文字快100萬倍,可視化本身即是強(qiáng)化記憶的手段——它更直抵人心。舉個(gè)例子,在我剛看完的電影《史蒂夫·喬布斯》最后,喬布斯指著女兒笨拙的隨身聽說:“我要把500到1000首歌裝到你的口袋里。”這就是一個(gè)典型的視覺沖擊場景,他可沒說“我要做個(gè)能裝1000首歌的機(jī)器。”再譬如,IDC研究報(bào)告顯示2020年預(yù)計(jì)全球新建和復(fù)制的信息量會超40ZB,沒啥感覺對吧,不如換個(gè)說法,2020年全球生產(chǎn)的數(shù)據(jù)將是地球上所有沙粒的4倍,你會本能腦補(bǔ)沙粒的畫面。
大數(shù)據(jù)也是如此。知道么,百度百科對大數(shù)據(jù)有個(gè)慘絕人寰的定義,復(fù)制給你:大數(shù)據(jù)“指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。”所以說,在實(shí)際應(yīng)用中,與大數(shù)據(jù)進(jìn)行視覺對話無疑是聰明之舉。
數(shù)據(jù)體量過大會導(dǎo)致第二個(gè)痛點(diǎn):難以分辨隨數(shù)據(jù)洪流裹挾而至的福音與噪音,從而在具體應(yīng)用中發(fā)現(xiàn)有效數(shù)據(jù)比較少。阿里巴巴集團(tuán)副總裁,數(shù)據(jù)分析師車品覺就寫過一個(gè)事:“巧遇到谷歌的前數(shù)據(jù)部門leader,他跟我說了一件他覺得很痛苦的事:提出數(shù)據(jù)需求的人往往70%的情況又不用提供給他的數(shù)據(jù)。他為此非常生氣,便質(zhì)問業(yè)務(wù)方:為什么你們老問我要數(shù)據(jù),結(jié)果卻不用?業(yè)務(wù)方回答說:是的,因?yàn)槲矣猛曛蟛胖肋@些數(shù)據(jù)沒有用。對于一個(gè)每天都要準(zhǔn)備數(shù)據(jù)的人來說,這好比你是一家餐廳的老板,廚師每天讓你準(zhǔn)備很多菜卻只用一小部分材料一樣痛苦。”
嗯,與老舊的餅狀和柱狀圖止于數(shù)據(jù)展示(先用數(shù)據(jù)再去做圖),形式大于內(nèi)容不同,從相互關(guān)聯(lián)的過程數(shù)據(jù)中尋找問題和需求,從而做出動態(tài)決策,才是數(shù)據(jù)可視分析最為重要的技能。
最后,在現(xiàn)實(shí)層面,目前在做數(shù)據(jù)分析的更多是技術(shù)人員,離企業(yè)業(yè)務(wù)還有段距離,而至少在現(xiàn)階段,決策層對數(shù)據(jù)的態(tài)度則多少有些若即若離,忽明忽暗——他們很感興趣,卻遠(yuǎn)未到離不開的份上。而數(shù)據(jù)可視化無疑是串聯(lián)決策層和數(shù)據(jù)層的最佳橋梁。