好吧,再回到大數(shù)據(jù)精準(zhǔn)廣告案例,其中一個(gè)最為關(guān)鍵的問題在于,大數(shù)據(jù)如何分析出這6千個(gè)瀏覽用戶適合投放手機(jī)廣告?對(duì)于這個(gè)問題,廣告公司早有準(zhǔn)備,給出如下的種種答案。
第一,從歷史記錄中尋找曾經(jīng)使用過同類產(chǎn)品的客戶進(jìn)行匹配。通常使用的算法叫“協(xié)同過濾”,即由某些經(jīng)驗(yàn)的相關(guān)性,找到潛在的適合用戶。比如你玩過某款游戲,因此可認(rèn)為你對(duì)該類型的其它游戲也有相同的需求。筆者并不否認(rèn)該算法對(duì)某些領(lǐng)域確實(shí)有作用,比如游戲付費(fèi)用戶基本就是之前重度游戲使用用戶。
但是拋開這些特殊領(lǐng)域,該算法內(nèi)涵思想“品牌依靠忠誠的消費(fèi)者發(fā)展壯大”與拜倫的理論完全矛盾。拜倫通過對(duì)銷售數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,他指出在所有成功的品牌當(dāng)中,大量的銷售來自“輕顧客”(Light buyer):也就是購買產(chǎn)品相對(duì)不那么頻繁的顧客。可口可樂的生意并非依靠每天都喝可樂的人,而是數(shù)百萬每年喝一次或兩次的顧客。這種消費(fèi)者模式在各個(gè)品牌、商品品類國家和時(shí)期都適用。無論是牙刷還是電腦,法國汽車或是澳大利亞銀行,品牌依靠的是大規(guī)模人口–換句話說,大眾–那些偶爾購買他們的人。
這個(gè)理論意義十分深遠(yuǎn)。這意味著你永遠(yuǎn)無法通過精準(zhǔn)營銷現(xiàn)有顧客來增加品牌的市場(chǎng)份額。而對(duì)現(xiàn)有顧客的精準(zhǔn)營銷,正是數(shù)字媒體所擅長的。
本著批判的精神來看待新出現(xiàn)未經(jīng)檢驗(yàn)的思想,筆者希望引用一下廣東移動(dòng)最近公布的用戶換機(jī)特征數(shù)據(jù)。廣東移動(dòng)對(duì)旗下用戶的終端遷移分析表明,使用蘋果的用戶升級(jí)終端,繼續(xù)使用蘋果手機(jī)的占比64%,忠誠度最高。但除蘋果以外,其余忠誠度表現(xiàn)最好的華為、小米手機(jī),更換4G后持續(xù)使用同品牌的占比不到30%。
這說明,你向蘋果4或5用戶推廣蘋果6是可行的,果粉效應(yīng)推翻拜倫的理論,證實(shí)在部分領(lǐng)域依靠忠誠的消費(fèi)者發(fā)展壯大是可行的。但除此以外,你向任何一個(gè)當(dāng)前品牌的用戶推廣同品牌的手機(jī)終端都是不合時(shí)宜的。
因此,希望通過歷史的電商數(shù)據(jù)分析推斷用戶下一步可能需要是無效的。就如向曾經(jīng)購買過服裝的用戶推廣服裝,或許不如推廣一卷紙或一桶油更為有效。
相反,成功的品牌需要找到一種方式來到達(dá)目標(biāo)市場(chǎng)之外的群體。品牌的廣告一定要用某種方式獲得這部分人的興趣–只有這樣,當(dāng)他們?cè)跍?zhǔn)備購買的時(shí)候,該品牌才能自動(dòng)出現(xiàn)在消費(fèi)者的腦海中。
第二,如果“協(xié)同過濾”存在局限,廣告公司會(huì)告訴你還有第二種算法,并不基于客戶的歷史行為記錄,而是客戶本身特征相似性,來找到與種子客戶最為相似的客戶群體。簡(jiǎn)稱“Lookalike”。先需要廣告主提供本則廣告起到作用的典型用戶,以手機(jī)為例,受廣告影響感興趣點(diǎn)擊瀏覽或預(yù)購某手機(jī)的用戶,大約幾百或幾千個(gè)。大數(shù)據(jù)公司通過Lookalike算法(專業(yè)的術(shù)語更可能是稀疏矩陣),尋找與這幾百/千個(gè)用戶高度相似的其它數(shù)十萬/百萬客戶群進(jìn)行投放。
這類算法真正考驗(yàn)大數(shù)據(jù)平臺(tái)的計(jì)算能力,因?yàn)椴⒉皇墙?jīng)驗(yàn)性的協(xié)同過濾,而是利用數(shù)十?dāng)?shù)百甚至上千個(gè)變量進(jìn)行回歸計(jì)算。最后按照相似性的概率打分,按照由高到低選擇合適的用戶群。
該模型的內(nèi)涵其實(shí)很簡(jiǎn)單,就是廣告要傳達(dá)給應(yīng)該傳達(dá)的客戶。比如奶粉廣告目標(biāo)用戶就是養(yǎng)育0-3歲孩子的父母。如果知道要到達(dá)用戶的具體身份,一切問題迎刃而解。但是對(duì)于網(wǎng)站或APP應(yīng)用來說,并不清楚用戶身份,唯一清楚的是客戶的歷史行為數(shù)據(jù)。而且由于數(shù)據(jù)本身的分割,有的專注于運(yùn)營商,有的專注于APP聯(lián)盟采集,有的專注于電商,有的專注于銀行,要從分割的數(shù)據(jù)中推斷出客戶的身份信息,Lookalike就是不可避免的手段。
唯一的問題是,如果由幾百個(gè)種子用戶推斷出新的幾百個(gè)目標(biāo)用戶,準(zhǔn)確性可能高達(dá)9成,但如果如某廣告公司宣稱,對(duì)康師傅辣味面進(jìn)行移動(dòng)DSP投放時(shí),根據(jù)歷史投放數(shù)據(jù)分析挖掘,形成樣本庫,再通過Lookalike技術(shù)進(jìn)行人群放大,找到與目標(biāo)受眾相似度最高的潛在客戶,擴(kuò)展人群1367萬,實(shí)際投放受眾ID2089萬。廣告效果投放是最大化了,那么效果呢?在此,請(qǐng)?jiān)试S我杜撰一個(gè)數(shù)字,很可能點(diǎn)擊率由0.2%上升至0.3%,精準(zhǔn)度提升50%。有意義嗎?或許有,但絕對(duì)沒有想象的那么明顯。
第三,如果你們持續(xù)懷疑我們算法的有效性,那么我們可以就效果來談合作,你們可以按照點(diǎn)擊量(CPC)或者激活量(CPA)付費(fèi),如果達(dá)不到既定效果,我們會(huì)補(bǔ)量。這是大數(shù)據(jù)廣告的終極武器。