建模必須與實(shí)際銷(xiāo)售場(chǎng)景結(jié)合,要么找出自然轉(zhuǎn)化率高的用戶(hù)采取更低成本的接觸方式轉(zhuǎn)化,要么找出一批用戶(hù)施加營(yíng)銷(xiāo)動(dòng)作后較自然轉(zhuǎn)化大大提升!
誤區(qū)三:盲目使用、過(guò)度依賴(lài)訓(xùn)練集! 訓(xùn)練集是個(gè)雙刃劍,正確使用能充分發(fā)揮技術(shù)算法的價(jià)值,而濫用則陷入誤區(qū)。前面說(shuō)的某央企案例,其實(shí)訓(xùn)練那些模型并不困難,不就把各渠道成功下單用戶(hù)作為訓(xùn)練集嘛,掌握工具的新手都能做出來(lái)。訓(xùn)練集要與準(zhǔn)備施加的營(yíng)銷(xiāo)動(dòng)作一致的才有意義。
訓(xùn)練集還要有代表性,譬如歷史的數(shù)據(jù)是和大客戶(hù)談妥對(duì)其所有員工批量轉(zhuǎn)化的,以這些數(shù)據(jù)為訓(xùn)練集就沒(méi)有任何意義。營(yíng)銷(xiāo)場(chǎng)景初始往往沒(méi)有訓(xùn)練集,必須跳出“訓(xùn)練集”局限。
誤區(qū)四:要相關(guān)不要因果! 《大數(shù)據(jù)時(shí)代》作者提出這個(gè)觀點(diǎn)的時(shí)候,其實(shí)并不是要放棄追求因果,而是找出相關(guān)關(guān)系后,更迫切的是接下來(lái)怎么做,因果關(guān)系可以慢慢研究。這一點(diǎn)被很多人誤讀,世間沒(méi)有無(wú)緣無(wú)故的愛(ài),也沒(méi)有無(wú)緣無(wú)故的恨,兩個(gè)事物相關(guān)度很高,背后必定有一串的因果鏈條,如果找不到,那可能是因?yàn)橛?xùn)練集的問(wèn)題導(dǎo)致偽相關(guān),我們就要警惕了。
誤區(qū)五:過(guò)于迷信算法! 大道至簡(jiǎn),有效的東西一定是簡(jiǎn)單的。非要復(fù)雜,那一定是因?yàn)闆](méi)找到或者沒(méi)掌握關(guān)聯(lián)度更高的原始數(shù)據(jù)。算法并不能解決所有問(wèn)題,沒(méi)有好的數(shù)據(jù)基礎(chǔ),它無(wú)能為力。建模涉及到很多關(guān)鍵要素,比拼的是綜合實(shí)力,在同等條件下,努力提升算法才是有意義的。
誤區(qū)六:盲目追求數(shù)據(jù)精度! 高的精度意味著更高的成本,對(duì)應(yīng)更少的數(shù)據(jù)規(guī)模,如何取舍就要運(yùn)用“法”篇說(shuō)的ROI原則了。
三、建模七術(shù)
1、場(chǎng)景驅(qū)動(dòng)
建模的第一件事情是搞清楚應(yīng)用場(chǎng)景,提煉賣(mài)點(diǎn)、利益點(diǎn),哪些是能打動(dòng)用戶(hù)的關(guān)鍵要素。從“命中目標(biāo)”和“命中營(yíng)銷(xiāo)特性”這兩個(gè)方面去思考我們要找什么樣的用戶(hù),匹配什么樣的關(guān)鍵特征。
2、迭代建模
建模要用互聯(lián)網(wǎng)思維“小步快跑,快速迭代”,快速對(duì)消費(fèi)者需求做出反應(yīng),否則數(shù)據(jù)會(huì)失去時(shí)效。因此我們應(yīng)從簡(jiǎn)單開(kāi)始入手,采用簡(jiǎn)單算法快速輸出數(shù)據(jù),后續(xù)在實(shí)戰(zhàn)中不斷檢驗(yàn)、修正、迭代優(yōu)化,不斷提升數(shù)據(jù)的精準(zhǔn)性。
3、場(chǎng)景還原
確定業(yè)務(wù)目標(biāo)后,還原用戶(hù)的生活場(chǎng)景,設(shè)想用戶(hù)的需求場(chǎng)景,再考察數(shù)據(jù)能否關(guān)聯(lián)。理解生活,數(shù)據(jù)挖掘會(huì)很簡(jiǎn)單。商業(yè)最終解決的是人們的物質(zhì)文化需求,你想挖掘什么樣的群體,先從生活中去理解它,它在什么場(chǎng)景下需要這些產(chǎn)品,有什么行為習(xí)慣,在我們的數(shù)據(jù)中留下了哪些蛛絲馬跡?譬如“外圍女”這個(gè)群體,你too simple對(duì)她們一無(wú)所知,就很難把她們找出來(lái)。為了挖掘“工業(yè)區(qū)人群”,我們特地組織前往廠區(qū)調(diào)研他們購(gòu)買(mǎi)手機(jī)、上網(wǎng)、生活習(xí)慣等情況,為了挖掘“出租車(chē)司機(jī)”,我們打車(chē)的時(shí)候?qū)λ麄冞M(jìn)行了訪談。
五個(gè)方面理解還原:
身份屬性:譬如商務(wù)精英消費(fèi)能力高使用Iphone手機(jī)比例高
狀態(tài)變化:譬如夜間位置變換,推測(cè)用戶(hù)搬家了有寬帶需求
行為表達(dá):譬如在社交網(wǎng)絡(luò)、搜索引擎等互聯(lián)網(wǎng)上表達(dá)了對(duì)目標(biāo)商品的關(guān)注
習(xí)慣偏好:譬如喜歡日本料理、西餐廳的人群超60%使用Iphone手機(jī)
關(guān)系推測(cè):譬如和快遞員交互的用戶(hù),我們推測(cè)它是一個(gè)電商消費(fèi)者
對(duì)于任何一個(gè)業(yè)務(wù)目標(biāo),都可以從上述五個(gè)方面還原與業(yè)務(wù)目標(biāo)相關(guān)聯(lián)的場(chǎng)景,還原足夠多的場(chǎng)景,就可以挖掘出足夠規(guī)模的用戶(hù)數(shù)據(jù)。
4、找數(shù)據(jù)關(guān)聯(lián)
還原出場(chǎng)景后,就要找數(shù)據(jù)進(jìn)行關(guān)聯(lián)。有些我們可以基于直接數(shù)據(jù)進(jìn)行輸出,沒(méi)有直接的數(shù)據(jù),則找間接數(shù)據(jù)選取算法進(jìn)行推導(dǎo),而間接數(shù)據(jù)的選取,可繼續(xù)應(yīng)用上述五個(gè)方面場(chǎng)景還原的方法。至于具體如何清洗數(shù)據(jù)、缺省異常值處理、算法選取、誤差分析等等那些實(shí)操細(xì)節(jié),文章很多。
5、快速收斂
建模是人與機(jī)器協(xié)作的結(jié)果,核心參與者是人,建模方向由人來(lái)確定,數(shù)據(jù)維度的選取主要是人(機(jī)器輔助驗(yàn)證),算法也是人設(shè)計(jì)的,機(jī)器所起的所用是訓(xùn)練迭代,而機(jī)器儲(chǔ)存的數(shù)據(jù)相對(duì)人腦太單一,人對(duì)數(shù)據(jù)結(jié)果、應(yīng)用結(jié)果進(jìn)行解讀,及時(shí)輸入一些理解能加快收斂的速度。