
流失預(yù)測(cè)模型在很多行業(yè)都有引用到切實(shí)的市場(chǎng)運(yùn)營當(dāng)中,而接下來就開門見山的說一下游戲行業(yè)有關(guān)用戶流失模型的建立。
目標(biāo):關(guān)于游戲用戶的流失,普片的衡量指標(biāo)有周流失與月流失,接下來研究的問題有兩個(gè):
① 有關(guān)付費(fèi)用戶的月登陸流失問題
② 有關(guān)付費(fèi)用戶的月付費(fèi)流失(付費(fèi)用戶的月登陸流失定義:本月充值的用戶在下個(gè)月不再有登陸行為。付費(fèi)用戶的月付費(fèi)流失:本月充值的用戶在下個(gè)月不在有付費(fèi)行為。但有可能還有登陸行為,這部分用戶被稱為沉默付費(fèi)用戶。)
數(shù)據(jù)指標(biāo)理解:影響流失的普片判斷有:在線活躍、充值或消費(fèi)活躍、還有玩家賬號(hào)一些屬性(如果細(xì)分還有副本的活躍度,某些活動(dòng)的活躍度,或者社交的數(shù)據(jù)等)。
本文在做流失預(yù)測(cè)模型之前做以下數(shù)據(jù)準(zhǔn)備:
- 玩家ID
- 玩家角色名
- 等級(jí)
- 注冊(cè)時(shí)間
- 本月充值總額
- 本月銅幣活躍(銅幣的交易次數(shù))
- 本月綁定銅幣活躍(綁定銅幣交易次數(shù))
- 本月元寶活躍(元寶交易次數(shù))
- 本月活躍天數(shù)(登陸天數(shù))
- 本月登陸次數(shù)
- 本月登陸總時(shí)長(zhǎng)
- 下月充值總額
- 下月登陸天數(shù)
以上是從數(shù)據(jù)庫中取出來的基本指標(biāo),而進(jìn)行分析的指標(biāo)可以在這個(gè)基礎(chǔ)指標(biāo)的基礎(chǔ)上再進(jìn)行豐富,例如:每活躍天在線時(shí)長(zhǎng)=登陸總時(shí)長(zhǎng)/活躍天數(shù);每活躍天登陸次數(shù)=登陸次數(shù)/活躍天數(shù);活躍度=活躍天數(shù)/本月已注冊(cè)時(shí)長(zhǎng)(大家將發(fā)現(xiàn)這里衍生的“活躍度”指標(biāo)在后面的分析會(huì)起到神奇的效果)。數(shù)據(jù)都準(zhǔn)備好了之后,現(xiàn)在就開始建立模型,以下用到的是SPSS Modeler軟件。

首先采用源節(jié)點(diǎn)來錄入數(shù)據(jù),數(shù)據(jù)分為兩份,第一份為“11月預(yù)測(cè)12月”數(shù)據(jù),第二份為“12月預(yù)測(cè)1月”的數(shù)據(jù)。

接著利用“導(dǎo)出”節(jié)點(diǎn)導(dǎo)出我們所需要的衍生字段。

因?yàn)檫@里的“下月充值流失”是根據(jù)下月是否有充值來判斷轉(zhuǎn)換的,下月充值為0即為流失則標(biāo)志為T,否則為F(“下月登陸流失”同理)。利用導(dǎo)出節(jié)點(diǎn),我們依次衍生了以下字段:
- 下月充值流失
- 下月登陸流失
- 每活躍天銅幣交換次數(shù)
- 每活躍天綁定銅幣交易次數(shù)
- 每活躍天元寶交易次數(shù)
- 每活躍天登陸次數(shù)
- 每活躍天登陸時(shí)長(zhǎng)
- 每活躍天充值額度
- 活躍度(登陸天數(shù)/本月已注冊(cè)天數(shù))
接下來就是對(duì)一些多余字段的過濾還有數(shù)據(jù)的清理(如包括空值的數(shù)據(jù),或者不合理數(shù)據(jù),如活躍度>1為不合理數(shù)據(jù))。

添加“過濾”&“選擇”節(jié)點(diǎn)。

把無用的字段過濾掉(根據(jù)自己源數(shù)據(jù)來過濾,如這里的下月充值(元寶)字節(jié)已經(jīng)轉(zhuǎn)換成“下月充值流失”字節(jié),所以可以刪除過濾掉),點(diǎn)擊確定。
打開“選擇”節(jié)點(diǎn),模式選擇“拋棄”,條件寫上一些需要清除的數(shù)據(jù),點(diǎn)擊確定。