Difference = (Units – Predicted Units) / Predicted Units
Step 3. 數(shù)據(jù)解讀
不難理解,如果實際值大于預(yù)測值,Difference為正,反之為負(fù),實際值與預(yù)測值差異越大,Difference的絕對值越大。
既然需要的數(shù)據(jù)都有了,該怎么看我們用戶的偏好呢?如何去發(fā)現(xiàn)那些有價值的信息呢?
Difference 一列中,最抓人眼球(eye-catching)的顯然是Shanghai-DSC那行了,372%。這表示,Shanghai的用戶比我們想象中的更熱衷于DSC產(chǎn)品,而且是遠(yuǎn)遠(yuǎn)大于預(yù)期。同樣,VAIO、Tablet等產(chǎn)品在Shanghai用戶中的銷售情況也比我們的預(yù)期要好。而HIFI的-80%,MDR的-59%,說明了Shanghai的用戶對這些產(chǎn)品并不是非常感興趣。當(dāng)然,如果在做這個分析前,你已經(jīng)對你的某些產(chǎn)品做了定向投放,那么會一定程度上影響該報告的解讀,這時候,我的建議是:
1. case by case的來分析那些定向投放了的產(chǎn)品,需要綜合考慮你的投放情況及業(yè)務(wù)情況
2. 剔除那部分定向投放了的產(chǎn)品及密切相關(guān)的產(chǎn)品,從而解讀那些未受太大影響的產(chǎn)品數(shù)據(jù)。
到這里,如果在讀這篇文章的你正從事Online Marketing等相關(guān)的工作,不知道有沒有能夠觸動到你的神經(jīng)呢?SEM、adwords等廣告投放平臺中的地理位置定位,能通過這個分析得到改進(jìn)嗎?花錢買的廣告,真的投放給那些感興趣的用戶了嗎?……
本文所謂的預(yù)測,并沒有基于什么很高級的算法,只是先假定了我們的所有用戶的偏好是一致的,基于這個假設(shè),兩個維度關(guān)聯(lián)后的情況應(yīng)當(dāng)與兩個維度獨立時所推斷的情況一致。還是舉個簡單的例子來說明吧。假定雙胞胎姐妹總共吃了4個水果,又知道水果中香蕉被吃了2個,蘋果也被吃了2個。如果姐妹倆的偏好一致,我們可以認(rèn)為姐妹應(yīng)該各自吃了1個香蕉1個蘋果。然而真實的情況是姐姐吃了2兩個香蕉,妹妹吃了2兩個蘋果,也就是說,姐姐比我們所認(rèn)為的多吃了1個香蕉而少吃了1個蘋果,那么她的偏好應(yīng)該是愛吃香蕉而不愛吃蘋果。
當(dāng)然,這樣的預(yù)測方法由于少考慮了很多因素而并變得不是很精準(zhǔn),但筆者認(rèn)為,這不會是什么很大的問題。雖然我們的計算過程是定量的,但我們的目的只是定性而已,380%的Difference在這個方法中跟370%沒有什么太大的區(qū)別。而且,以損失一些精度為代價,獲得更高的效率并非什么不可原諒的事,畢竟我們是在商場里作戰(zhàn),而不是在學(xué)校碼論文。
最后想說的是,本文所舉例子是不同城市用戶關(guān)于不同產(chǎn)品類的購買偏好分析,實際上,朋友們完全可以根據(jù)自己的業(yè)務(wù)需求來驅(qū)動類似的分析,比如關(guān)聯(lián)用戶的操作系統(tǒng)(Operating System)和瀏覽器(Browser),指標(biāo)選擇訪問數(shù)(Visits),便能了解到你網(wǎng)站的用戶在不同操作平臺上更喜歡用哪種瀏覽器。
理論上來說,任意兩個維度都可以關(guān)聯(lián)起來,且能說明些問題,但不建議強(qiáng)行地去關(guān)聯(lián)兩個維度,然后絞盡腦汁地去賦予它某種意義,不要為了分析而分析。還是那句話,以業(yè)務(wù)需求來確定分析目標(biāo),再以分析結(jié)果來驅(qū)動業(yè)務(wù)發(fā)展。
如果您有任何想法或者建議或者批評,請不要吝嗇給我留言!
作者:Leslie
更多詳細(xì)信息,請您微信關(guān)注“計算網(wǎng)”公眾號: