這是筆者在這新博客上的第一篇文章,對于第一篇文章,我糾結(jié)了半天,不知道寫什么最好。或許是怕所寫的內(nèi)容對讀者沒有幫助,亦或是老生常談大家看膩了的東西。
思考良久,終于決定寫下這篇您正看到的文章,關(guān)于分析用戶偏好的一些分享。之所以寫這個(gè)內(nèi)容,一方面是因?yàn)檫@個(gè)主題在國內(nèi)的網(wǎng)站分析相關(guān)的博客上能找到的文章不多,另一方面,我所介紹的方法有較大的應(yīng)用空間,或許可以給大家?guī)硪恍﹩l(fā)。
用戶偏好分析是一個(gè)比較大的題目,哪怕只是將它局限在網(wǎng)站分析領(lǐng)域中,也可以從各種角度入手來了解你的網(wǎng)站用戶。限于篇幅和筆者本身的能力,這里將介紹的是筆者認(rèn)為比較實(shí)用的,也認(rèn)為是容易上手和擴(kuò)展的方法,也同時(shí)希望能夠起到拋磚引玉的效果。
【正文】
熟悉網(wǎng)站分析的朋友們都知道,GA(Google Analytics)中可以關(guān)聯(lián)不同的維度(Dimension),比如“城市”和“產(chǎn)品”,通過關(guān)聯(lián)(Sub-relation),我們可以得到不同城市下,各產(chǎn)品的相關(guān)數(shù)據(jù)。在Omniture的幾個(gè)網(wǎng)站分析工具中,也同樣能夠?qū)δ硞€(gè)eVar根據(jù)按另一個(gè)eVar來breakdown。
好了,廢話不多說,接下來就讓我們一起去發(fā)現(xiàn)一些有趣的事情!
Step 1. 獲取數(shù)據(jù)
1.a 請生成一張報(bào)表,
維度(Dimension):城市(Cities)
指標(biāo)(Metric):購買數(shù)量/銷量(Units)
時(shí)間段可根據(jù)需要設(shè)定,時(shí)間粒度(Granularity)在Omniture中選None/aggregate,表示把時(shí)間以聚合的方式展現(xiàn),而不是按daily、monthly等方式來劃分,GA中同理。

好了,我們得到了一張關(guān)于各個(gè)城市的訪客所產(chǎn)生的訂單數(shù)的報(bào)告,第三列Ratio是經(jīng)過計(jì)算得到的各城市訂單數(shù)占總體的比例。這里假定了只有圖表中所列出的10個(gè)城市,所有數(shù)據(jù)均為模擬數(shù)據(jù)。
1.b 類似上一張城市報(bào)告,我們再獲得一份產(chǎn)品類(Product Category)的報(bào)告,維度:Category, 指標(biāo):Units,獲得的報(bào)告如下

* 這里需要注意,你所看到的兩張表中的Units總量是一樣的,但如果你選擇了Orders作為Metric的話,那么品類報(bào)告中的Orders應(yīng)該會(huì)大一些,因?yàn)橛行┯脩舻膯蝹€(gè)訂單橫跨了不同的產(chǎn)品類。比如實(shí)際情況是你下了一個(gè)訂單,包含了一臺VAIO和一臺DSC,那么在產(chǎn)品類報(bào)告中這1個(gè)訂單會(huì)被分拆為2個(gè),各自歸屬到2個(gè)品類中。如果Orders總量相差不大,那不用太在意這個(gè)差異,如果你覺得差異讓你無法接受的話,那也不難,對城市報(bào)告中的數(shù)據(jù)做個(gè)簡單處理:處理后各城市訂單數(shù) = 處理前各城市訂單數(shù) * (產(chǎn)品類報(bào)告訂單總數(shù) / 處理前城市訂單總數(shù))。但是這樣的處理會(huì)稍許影響到后續(xù)介紹的計(jì)算過程,當(dāng)然,只要你保持頭腦清醒,相信在理解了算法后根據(jù)需要來修改也不是難事。
1.c 獲得一份Sub-relation的報(bào)告,第一個(gè)維度選擇城市,第二個(gè)維度選產(chǎn)品類,指標(biāo)仍然是Units,報(bào)表如下:

City Breakdown by Category
限于篇幅,圖中只顯示了Shanghai的數(shù)據(jù),實(shí)際應(yīng)該是所有其它城市都會(huì)得到跟Shanghai類似結(jié)構(gòu)的數(shù)據(jù)。由于本例中共有10個(gè)城市和10個(gè)產(chǎn)品類,因此得到的數(shù)據(jù)應(yīng)該是10*10=100行。同樣,這里的Units總量應(yīng)該與之前的相同。
從表中我們可以知道,在Shanghai所產(chǎn)生的962個(gè)Units中,VAIO占了378個(gè),DSC占了112個(gè),這個(gè)很容易理解。
Step 2. 數(shù)據(jù)處理

Difference
如上圖所示,我們在1.c報(bào)表的基礎(chǔ)上,新增一列Predicted Units,作為我們預(yù)測的商品銷量,怎么計(jì)算呢?Predicted Units = 1.a中Shanghai的 Units * 1.b中VAIO的Ratio(或者1.a中Shanghai 的 Ratio * 1.b中VAIO的Units也是一樣的)
然后我們再新增一列Difference,表示實(shí)際值與預(yù)測值的差異程度,計(jì)算方式為:
更多詳細(xì)信息,請您微信關(guān)注“計(jì)算網(wǎng)”公眾號: