所以就有各種數(shù)據(jù)透視分析的視角。
總結(jié):
數(shù)據(jù)分析就是在撥弄各種數(shù)據(jù)立方體,你可以切片、切塊、鉆取、匯總,你所玩的魔方每一塊,就是一個具體的度量值,是什么數(shù)字,則是多種維度交叉后的結(jié)果。
工作實踐中,數(shù)據(jù)產(chǎn)品經(jīng)理會考慮做出更加方便易用的“立方體玩法”以供普通用戶使用:
如,在分析客戶來電的自動語音導(dǎo)航服務(wù)中,我們就可以按不同的維度去對比看用戶在導(dǎo)航菜單里按鍵量,下圖所示是“按菜單對比”的界面,在“對比按”中可以進(jìn)行切換其他對比視角。
至于左側(cè)的兩個篩選,也即指篩選數(shù)據(jù)集合(切片或切塊了),比如限定某幾個熱線和菜單去看。
3. 一張圖片
了解了維度、度量兩個詞,又有了立方體之概念,讓我們再來看數(shù)據(jù)是怎么產(chǎn)生,怎么被放到用戶界面上供查詢使用的。
- 巧婦難為無米之炊。數(shù)據(jù)不是憑空產(chǎn)生的,當(dāng)需求方提出想要什么樣的數(shù)據(jù)分析的時候,首先要檢視的是,TA需求中涉及到的維度是否確定被采集到?度量的計算成本是否高?比如若一個需求想要分析不同買家分層的留存,買家分層是一個新維度,需求方是按骨灰級、高級、新手等對買家進(jìn)行分層。且什么叫骨灰級?系統(tǒng)里并未對買家進(jìn)行打標(biāo)記,且不同類目的骨灰級算法還不一樣,加上算法定義本身也在磨合。這種情況下,我們應(yīng)該和需求方一起推動業(yè)務(wù)系統(tǒng)完成打標(biāo),而不是自己接下這個需求,在數(shù)據(jù)倉庫ETL環(huán)節(jié)完成。
- 了解ETL:這個是做數(shù)據(jù)工作繞不開的術(shù)語,E(抽取、清洗)——T(轉(zhuǎn)換)——L(裝載),抽取是從各個業(yè)務(wù)系統(tǒng)中抽取所需的數(shù)據(jù),然后完成語義層、邏輯層的轉(zhuǎn)換,比如不同系統(tǒng)中記錄銷售渠道這個維度,有的叫做saleschannel,有的叫做channel,需要轉(zhuǎn)化為同一個概念。裝載,也可以理解成抽取、清洗、轉(zhuǎn)換好了,裝載到另外一個空間里,供多維查詢服務(wù)應(yīng)用調(diào)用。
當(dāng)然,則個領(lǐng)域,水很深,我只能簡單描述一下,再深的也擔(dān)心大家暈菜了——畢竟本文是寫給非數(shù)據(jù)人的。(其實作者本人也講不粗來了……哈哈)
四. 應(yīng)用
我說了,我無法教你具體復(fù)雜的數(shù)據(jù)分析案例。我希望能夠借助本文和你分享下如何建立起比較專業(yè)的數(shù)據(jù)分析思路——數(shù)據(jù)產(chǎn)品經(jīng)理本身也應(yīng)該可以是優(yōu)秀的數(shù)據(jù)分析師。
1. 三部曲——建立分析框架
- 建立分析框架:了解業(yè)務(wù)、以及業(yè)務(wù)想要什么(目標(biāo))。
- 提交數(shù)據(jù)需求: 根據(jù)你的訪談、梳理,得到業(yè)務(wù)流程、業(yè)務(wù)愿景以及目標(biāo),那么就可以和需求方共同確認(rèn)“看什么”以及“怎么看”。好的數(shù)據(jù)產(chǎn)品經(jīng)理或者數(shù)據(jù)分析師,永遠(yuǎn)不是坐等需求方提出他要看什么度量和維度,而是要引導(dǎo)對方看更合適的東西以回答他關(guān)于目標(biāo)是否達(dá)成的問題。
- 進(jìn)行數(shù)據(jù)分析:使用多種維度,進(jìn)行總體的、細(xì)分的、多維的分析,當(dāng)發(fā)現(xiàn)問題時,能夠使用這些維度的組合幫助用戶找到影響原因。
一切都基于你有多了解業(yè)務(wù):
下圖是幾年前的老圖了,左側(cè)是業(yè)務(wù)流程圖(業(yè)務(wù)流程圖怎么畫),右側(cè)是概念中的數(shù)字體系示意(可視化是為了更好和需求方溝通)。
PPT里因為存在具體業(yè)務(wù)的案例,不便分享,到此為止吧。如果有時間的話,我還是會編脫離具體業(yè)務(wù)的案例的……這就是寫博客的苦逼之處,工作中都是工作的案例,為了寫篇博客,還得自己再編一套有板有眼的故事……