一個(gè)故事:在信用卡起步階段,銀行從業(yè)人員憑經(jīng)驗(yàn)認(rèn)為警察信用是最高的,教師次之,商人最差。但當(dāng)銀行對他們消費(fèi)和還款數(shù)據(jù)的積累日漸豐富,分析結(jié)果出乎人的意料之外。
最初的結(jié)論幾乎被完全推翻:警察的信用最差,教師還款最及時(shí),但消費(fèi)偏向理性很少透支,而商人信用居中,卻對銀行的利潤貢獻(xiàn)率最高。誰是最優(yōu)質(zhì)的信用卡客戶的答案呼之欲出。
當(dāng)然這只是個(gè)段子,權(quán)當(dāng)玩笑。如今僅憑職業(yè)這種單一維度做判斷的方式,在銀行從業(yè)人員看來極其不可信。為了更好對癥下藥,他們需要得到你更多的信息。
在這點(diǎn)上,互聯(lián)網(wǎng)公司神通廣大。只要你一上網(wǎng),你的瀏覽記錄、外出行蹤、跳轉(zhuǎn)軌跡、好友關(guān)系、購買記錄、支付情況……就會被密密麻麻的數(shù)據(jù)記錄下來,在網(wǎng)上,誰也不知道對面坐著的是人還是一條狗,而未知的你,沒有遮羞布。
似乎有點(diǎn)危言聳聽。其實(shí)在你成為他們用戶的那一天起,不管你是不是仔細(xì)看了那個(gè)又長又晦澀的隱私政策,你點(diǎn)擊“下一步”之后,他們就心安理地獲得使用你這些數(shù)據(jù)的授權(quán),而保密原則也一并在法律的限定范圍之內(nèi)。在此之后,你不發(fā)現(xiàn)你使用互聯(lián)網(wǎng)已經(jīng)越來越方便了嗎?甚至方便得有些神奇。
你會發(fā)現(xiàn)微博已經(jīng)越來越了解你了,它給你推薦的人越來越靠近你線下的圈子;電子商務(wù)網(wǎng)站也越來越懂你了,你不必再發(fā)愁怎么找到心儀的那件商品,甚至你會發(fā)現(xiàn)有些推薦商品比你原本想買的更適合你;你剛剛在優(yōu)酷看到的一個(gè)不錯(cuò)的影片推薦,在下一個(gè)站點(diǎn),或許你將受到推送這張碟片的促銷信息……
幕后黑手“神秘組合”
誰是幕后的黑手?在你看來垃圾的信息,有人將其視為珍寶,處理、分析、整合,垃圾信息變廢為寶,產(chǎn)生價(jià)值,或二次出售或留待自用。這,就是數(shù)據(jù)挖掘與分析;這,幾乎是每個(gè)互聯(lián)網(wǎng)公司自誕生之日起就必須做的一件事情。
一般來說,單個(gè)的信息(排除VIP式的專屬服務(wù))是沒有任何意義的,只要經(jīng)過整合、經(jīng)過特殊的算法匹配才能得出對你而言最接近需求的服務(wù),而精準(zhǔn)是你為它買單的最大推動(dòng)力。
這里牽涉兩個(gè)層面的問題。一個(gè)是對你貢獻(xiàn)的數(shù)據(jù)的收集、挖掘和分析;另一個(gè)則是,有了關(guān)于你作為“你”的總體特征之后,能用這些“知識”去做什么而快速地賺到錢呢?這,是數(shù)據(jù)工程師們守口如瓶的“秘密”。
萬能的數(shù)據(jù)還不存在
數(shù)據(jù),絕不是萬能的。比如,某個(gè)新聞門戶根據(jù)你的歷史點(diǎn)擊,分析你瀏覽的頁面、停留的時(shí)間,預(yù)估你可能的興趣與愛好。不過,這并不具有可持續(xù)性,活生生的人,總是靈動(dòng)的變化著,如果網(wǎng)站對你針對性的發(fā)布,可能你今天很欣喜明天就比耐煩的把鼠標(biāo)移動(dòng)到右上角上點(diǎn)了叉。
所以,后臺那些整日琢磨怎么從你行為軌跡上挖掘你需求的工程師們,要絞盡腦汁調(diào)整假設(shè)、修正算法。數(shù)據(jù)大牛們只要看看一個(gè)互聯(lián)網(wǎng)公司收集數(shù)據(jù)的基礎(chǔ)表格都可以大體知道這家公司的數(shù)據(jù)沉淀及數(shù)據(jù)應(yīng)用水平了。
當(dāng)然了,他們即便有再強(qiáng)大的算法,還要有勞您繼續(xù)日復(fù)一日地去瀏覽網(wǎng)頁、去交友通信、去簽到、去下單買東西啦!他們巴不得網(wǎng)絡(luò)就是你的全部。