2. 維度:即Dimension。指我們平時看事物的角度。比如,同樣是網站瀏覽次數(shù)(PV),我們可以從日期角度去看,也可以以流量來源去看(來自直接訪問的、來自微博的、來自搜索的等),也可以以新老用戶分群來看。更多的場景是同時以兩個維度的組合去看,比如這樣的圖,就是同時結合了時間、來源兩個維度對網站流量進行分析:
兩者你知道如何清楚區(qū)分嗎?
雖然從定義上,你可以看出明顯不同,但是現(xiàn)實中,卻還是有人喜歡亂用——把明明屬于維度的東西寫成“我要看什么指標”,或者喜歡用“我想從收藏人數(shù)這個維度去看”,雖然我屬于強迫癥,喜歡幫別人的需求糾錯,被冠以扣字眼的“名號”,但是在這件事情,我一定要摳到底。
而且,你摳清楚了,以后你的世界也清晰很多。
區(qū)分的一個方法:維度,一定是有成員值的,且成員值是可以枚舉出來的——不管它有多少,大不了你多花點時間去枚舉,總之是一定可以枚舉的,且會維持一定的穩(wěn)定性。
比如,日期這個維度,幾月幾號一定是有限的,一年也就365天,如果是年這個維度,也是一樣的。城市這個維度更好理解了吧?
其他你需要了解的:
1. 度量:
- 除了指標這個有著略略差異的俗稱外,有時還會遇到衍生指標這個說法,比如拿指標A和指標B做運算得到的指標C就叫做衍生指標。此外,還要注意可累加以及不可累加的度量說法,比如網站UV(獨立訪問用戶數(shù)),這個指標就是典型的不可累加的度量:
- 除了指標這個有著略略差異的俗稱外,有時還會遇到衍生指標這個說法,比如拿指標A和指標B做運算得到的指標C就叫做衍生指標。此外,還要注意可累加以及不可累加的度量說法,比如網站UV(獨立訪問用戶數(shù)),這個指標就是典型的不可累加的度量:
- 某網站1月1日UV=100個,1月2日UV=200個,但是這兩天的UV不等于300個,因為1月2日的獨立用戶數(shù)里可能包含了1月1日的用戶,所以如果要得到2天的UV,需要重新計算而不能直接相加。而像成交類的金額,不涉及到去重的問題,就叫可累加的度量。
2. 維度:
- 維度的層次:即Level。有些維度是獨立并列的關系,比如城市維度和時間維度。但是有些維度之間有層次關系,比如省份維度和城市維度,行業(yè)維度和類目維度,年級維度和班級維度等。有層次關系的維度,則可用于“鉆取”場景中,先匯總到比較粗的維度,當有需要的時候,可以層層鉆取到更加明細的維度,此時,也會把這些維度叫做某維度類型的不同“粒度”——比如會有一個虛擬的維度類型曰地區(qū)維度,而把省份、城市、區(qū)叫做地區(qū)維的粒度。維度的層次根據(jù)不同的需求,可能會鉆取到很細(Details),那就是通常我們說的”明細數(shù)據(jù)”了。比如分析成交金額時,從行業(yè)維度,細分到一級類目乃至葉子類目,最后,鉆取到某個獨立的商品ID(不能再細了),商品ID就是最細小的層次維度。
這么說可能會把你繞暈,那么還是畫個圖吧(我真的適合當唐僧似的老師……o(╯□╰)o)
如上圖所示,左列也即維度,不管是國家、省份、城市,都是維度,但因為他們有層次關系,所以,有時會被描述為地區(qū)維度的不同粒度或層次(明白了吧)。而右側就是每個維度的維度成員了,有時也被叫成維度值。在可累加的度量中,每一個維度值相加,應該等于上級維度的某成員值總和。比如若城市A只有三個區(qū),這三個區(qū)的人口總數(shù)應該等于城市A的。
- 維度的屬性:用以描述維度的一些屬性,比如上圖中“城市”這個維度吧,它可能會有一些屬性特征,比如城市類型:省會城市、地級市、縣級市等,那么有一個分析需求,可能還會按不同城市類型匯總細分。這種情況,維度的屬性會成為分析中的維度。
這時,你可能會明白,平時為什么那么多表單要填寫各種字段,這些字段,都可能是分析時的維度哦~