一種是共性化推薦,結(jié)果就是推薦了流行的東西,這也許是好 的,但這也許會(huì)是用戶(hù)已知的東西,比如,到了北京,我想找個(gè)飯館,你總是給我推薦烤鴨,我想去個(gè)地方,你總是給我推薦天安門(mén)故宮天壇(因?yàn)榇蠖鄶?shù)人來(lái)北京就是吃烤鴨,就是去天安門(mén)的),這些我不都知道了嘛,還要你來(lái)推薦?另外,共性化的東西通常是可以被水軍刷的。
另一種是一種是個(gè)性化推薦,這個(gè)需要分析用戶(hù)的個(gè)體喜好,好的就是總是給我我喜歡的,不好的就是也許我的口味會(huì)隨我的年齡和環(huán)境所改變,而且,總是推薦符合用戶(hù)口味的,不能幫用戶(hù)發(fā)掘新鮮點(diǎn)。比如,我喜歡吃辣的,你總是給我推薦川菜和湘菜,時(shí)間長(zhǎng)了我也會(huì)覺(jué)得煩的。
推薦有時(shí)并不是民主投票,而是專(zhuān)業(yè)用戶(hù)或資深玩家的建議;推薦有時(shí)并不是推薦流行的,而是推薦新鮮而我不知道的。你可以看到,不同的業(yè)務(wù)場(chǎng)景,不同的產(chǎn)品形態(tài)下的玩法可能完全不一樣,
另外,就算是對(duì)于同一個(gè)電子商務(wù)來(lái)說(shuō),書(shū)、手機(jī) 和服裝的業(yè)務(wù)形態(tài)完全不一樣。我之前在Amazon做Demand Forecasting(用戶(hù)需求預(yù)測(cè))——通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)用戶(hù)未來(lái)的需求。
對(duì)于書(shū)、手機(jī)、家電這些東西,在Amazon里叫Hard Line的產(chǎn)品,你可以認(rèn)為是“標(biāo)品”(但也不一定),預(yù)測(cè)是比較準(zhǔn)的,甚至可以預(yù)測(cè)到相關(guān)的產(chǎn)品屬性的需求。
但是地于服裝這樣的叫Soft Line的產(chǎn)品,Amazon干了十多年都沒(méi)有辦法預(yù)測(cè)得很好,因?yàn)檫@類(lèi)東西受到的干擾因素太多了,比如:用戶(hù)的對(duì)顏色款式的喜好,穿上去合不合身,愛(ài)人朋友喜不喜歡…… 這類(lèi)的東西太容易變了,買(mǎi)得人多了反而會(huì)賣(mài)不好,所以根本沒(méi)法預(yù)測(cè)好,更別Stock/Vender Manager 提出來(lái)的“預(yù)測(cè)某品牌的某種顏色的衣服或鞋子”。
對(duì)于需求的預(yù)測(cè),我發(fā)現(xiàn),長(zhǎng)期在這個(gè)行業(yè)中打拼的人的預(yù)測(cè)是最準(zhǔn)的,什么機(jī)器學(xué)習(xí)都是浮云。機(jī)器學(xué)習(xí)只有在你要面對(duì)的是成千上萬(wàn)種不同商品和品類(lèi)的時(shí)候才會(huì)有意義。
數(shù)據(jù)挖掘不是人工智能,而且差得還太遠(yuǎn)。不要覺(jué)得數(shù)據(jù)挖掘什么事都能干,找到一個(gè)合適的業(yè)務(wù)場(chǎng)景和產(chǎn)品形態(tài),比什么都重要。
數(shù)據(jù)的分析結(jié)果
我看到很多的玩大數(shù)據(jù)的,基本上干的是數(shù)據(jù)統(tǒng)計(jì)的事,從多個(gè)不同的維度來(lái)統(tǒng)計(jì)數(shù)據(jù)的表現(xiàn)。最簡(jiǎn)單最常見(jiàn)的統(tǒng)計(jì)就是像網(wǎng)站統(tǒng)計(jì)這樣的事。比如:PV是多少,UV是多少,來(lái)路是哪里,瀏覽器、操作系統(tǒng)、地理、搜索引擎的分布,等等,等等。
嘮叨一句,千萬(wàn)不要以為,你一天有十幾個(gè)T的日志就是數(shù)據(jù)了,也不要以為你會(huì)用Hadoop/MapReduce分析一下日志,這就是數(shù)據(jù)挖掘了,說(shuō)得難聽(tīng)一點(diǎn),你在做的只不過(guò)是一個(gè)統(tǒng)計(jì)的工作。那幾個(gè)T的Raw Data,基本上來(lái)說(shuō)沒(méi)什么意義,只能叫日志,連數(shù)據(jù)都算不上,只有你統(tǒng)計(jì)出來(lái)的這些數(shù)據(jù)才是有點(diǎn)意義的,才能叫數(shù)據(jù)。
當(dāng)一個(gè)用戶(hù)在面對(duì)著自己網(wǎng)店的數(shù)據(jù)的時(shí)候,比如:每千人有5個(gè)人下單,有65%的訪(fǎng)客是男的,18-24歲的人群有30%,等等。甚至你給出了,你打敗了40%同類(lèi)型商家的這樣的數(shù)據(jù)。作為一個(gè)商戶(hù),面對(duì)這些數(shù)據(jù)時(shí),大多數(shù)人的表現(xiàn)是完全不知道自己能干什么?是把網(wǎng)站改得更男性一點(diǎn),還是讓年輕人更喜歡一點(diǎn)?完全不知道所措。
只要你去看一看,你會(huì)發(fā)現(xiàn),好些好些的數(shù)據(jù)分析出來(lái)的結(jié)果,看上去似乎不錯(cuò),但是其實(shí)完全不知道下一步該干什么?
所以,我覺(jué)得,數(shù)據(jù)分析的結(jié)果并不僅僅只是把數(shù)據(jù)呈現(xiàn)出來(lái),而更應(yīng)該關(guān)注的是通過(guò)這些數(shù)據(jù)后面可以干什么?如果看了數(shù)據(jù)分析的結(jié)果后并不知道可以干什么,那么這個(gè)數(shù)據(jù)分析是失敗的。
總結(jié)
綜上所述,下面是我覺(jué)得數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)最重要的東西:
1)數(shù)據(jù)的質(zhì)量。分為數(shù)據(jù)的標(biāo)準(zhǔn)和數(shù)據(jù)的準(zhǔn)確。數(shù)據(jù)中的雜音要盡量地排除掉。為了數(shù)據(jù)的質(zhì)量,大量人肉的工作少不了。
2)數(shù)據(jù)的業(yè)務(wù)場(chǎng)景。我們不可能做所有場(chǎng)景下的來(lái),所以,業(yè)務(wù)場(chǎng)景和產(chǎn)品形態(tài)很重要,我個(gè)人感覺(jué)業(yè)務(wù)場(chǎng)景越窄越好。
3)數(shù)據(jù)的分析結(jié)果
3/4 首頁(yè) 上一頁(yè) 1 2 3 4 下一頁(yè) 尾頁(yè)
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):