誠然,每個個體的行為也許都不盡相同,但都是有規(guī)律的。通過海量數(shù)據(jù)的獲取與分析,能夠獲得人們的行為習(xí)慣的有效信息,當(dāng)信息量累積到足夠的規(guī)模之后,科學(xué)家們通過建模找尋數(shù)據(jù)間的聯(lián)系,從而對每個人的個體行為習(xí)慣進行推測,并提供分析。而“棱鏡”計劃正是通過海量數(shù)據(jù)的收集,建模與分析,找尋到單一個體與諸如“恐怖襲擊”、“隱藏罪案”等事件間的聯(lián)系,并采取相應(yīng)應(yīng)對方式的計劃。
當(dāng)洛杉磯警方通過“棱鏡”計劃所收集到的數(shù)據(jù),對幾十年的犯罪記錄進行分析后,預(yù)測犯罪行為模式與頻率,從而有針對地安排警力的時候,廣告主也可以通過分析海量客戶的購買行為能夠了解客戶,進行有針對的營銷以提升業(yè)務(wù),而易傳媒人群標(biāo)簽算法,就是幫助廣告主了解用戶并提升投放效果的數(shù)據(jù)分析模型,是“活”的大數(shù)據(jù)的現(xiàn)實實踐者。
“活”的大數(shù)據(jù)實踐者——
美國記者華萊士曾經(jīng)談笑風(fēng)生地說:“如果它看起來像鴨子,游泳像鴨子,叫聲像鴨子,那么它可能就是只鴨子。”
而易傳媒人群標(biāo)簽算法,就是幫助廣告主找到“鴨子”。
在營銷界,啤酒和尿布的案例一直為人們所熟悉。普通人可能無法理解,為什么尿布與啤酒這兩種風(fēng)馬牛不相及的商品擺在一起,居然使兩者的稍量大幅增加。原來,媽媽們通經(jīng)常會囑咐丈夫在下班回家的路上為孩子買尿布,而丈夫在買尿布的同時又會順手購買自己愛喝的啤酒。這個發(fā)現(xiàn)為商家?guī)砹舜罅康睦麧?,而在互?lián)網(wǎng)浩如煙海卻又雜亂無章的數(shù)據(jù)中,發(fā)現(xiàn)類似“啤酒和尿布”之間聯(lián)系,就是人群標(biāo)簽算法的核心價值所在。
人群標(biāo)簽算法首先根據(jù)互聯(lián)網(wǎng)的行為屬性將人進行了區(qū)隔,隨后分析不同人群之間的共同屬性,建立人群間的聯(lián)系并應(yīng)用于后續(xù)的廣告投放。
這好比某超市門店發(fā)現(xiàn):老張買了2瓶啤酒、4袋花生米??墒窃诔兄校私庖粋€又一個老張們的喝酒習(xí)慣沒有意義。門店需要知道的是,有多少個老張?又有多少個喝酒習(xí)慣不同的老李?將喝啤酒配花生米的老張與喝干白葡萄酒配腰果的老李分開,分成不同的客戶群體才有意義。比如只要知道,在喝酒的100個客戶里,有30個喝啤酒配花生米的老張,10個喝干白葡萄酒配腰果的老李,另外有20個老王是喝黃酒配豆腐干,這就足夠了。這時就可以知道,啤酒與花生米有關(guān)系,干白葡萄酒與腰果有關(guān)系,黃酒與豆腐干有關(guān)系,那么這些商品可以考慮一起促銷,或者擺放在相近的位置進行陳列。
易傳媒人群標(biāo)簽算法,是將互聯(lián)網(wǎng)上的“老張”、“老李”、“老王”區(qū)分開,并找到他們真正關(guān)注的內(nèi)容,將其標(biāo)簽化處理后,分析標(biāo)簽間的關(guān)系并進行關(guān)聯(lián)化投放的算法。比如我們發(fā)現(xiàn)到把瀏覽汽車網(wǎng)站作為每天必做事項的老張,也經(jīng)常搜索“LED電視”,從而對其標(biāo)記“汽車”與“LED電視”的人群標(biāo)簽,當(dāng)發(fā)現(xiàn)千千萬萬個“老張”都同時具有“汽車”與“LED電視”標(biāo)簽的時候,我們發(fā)現(xiàn)這兩個標(biāo)簽似乎存在某種必然的聯(lián)系,便可對這些“老張”們,投放LED電視的廣告了。而這在過去,僅憑經(jīng)驗主義大行其道的時代,汽車與LED電視,便如啤酒與尿布一樣,是風(fēng)馬牛不相及的兩種東西,是萬萬想不到這兩者之間的聯(lián)系的。
互聯(lián)網(wǎng)的海量數(shù)據(jù)不僅可以提煉歸類并開發(fā)成為實用的系統(tǒng)工具,在實際執(zhí)行中,數(shù)據(jù)也是無處不在并且可以被擴展化使用的。而“人群標(biāo)簽算法”就是賦予數(shù)據(jù)活力,使大數(shù)據(jù)“活”起來的一種典型體現(xiàn)。人群標(biāo)簽算法是通過線上人群行為數(shù)據(jù)的收集,抽取并標(biāo)記以產(chǎn)品導(dǎo)向的興趣標(biāo)簽,經(jīng)由人群標(biāo)簽聚類,并對人群進行行為及興趣趨勢分析的流程化算法。
通過持續(xù)的、多渠道的、海量的數(shù)據(jù)收集及管理,易傳媒從線上到線下,從在線到移動,將受眾進行納米級微分,幫助廣告主最準(zhǔn)找到人、管理人,支持強大的受眾區(qū)隔,提供包括26類人口屬性細(xì)分、20大類159小類行為興趣細(xì)分、3大類產(chǎn)品行業(yè)、數(shù)千種行業(yè)產(chǎn)品意向細(xì)分,共13000多個、3層結(jié)構(gòu)的受眾標(biāo)簽。
大數(shù)據(jù)時代,最大的創(chuàng)新就在于,人們可以通過算法科學(xué)家及數(shù)據(jù)分析師們不斷調(diào)整優(yōu)化的數(shù)據(jù)模型來解讀大腦無法處理的數(shù)據(jù)間關(guān)系,我們的四周充斥著數(shù)據(jù),而我們的生活也被不斷收集數(shù)據(jù)的計算機引導(dǎo)并優(yōu)化著。