在互聯(lián)網(wǎng)上,數(shù)據(jù)就是金錢。對(duì)于這一點(diǎn),商品交易網(wǎng)站應(yīng)該最有體會(huì)。做為全球最大的拍賣網(wǎng)站,Ebay 擁有的數(shù)據(jù)量是驚人的。那么,公司是如何利用這些數(shù)據(jù)來(lái)促進(jìn)在線交易的呢?最近,Ebay 的搜索及平臺(tái)副總裁 Hugh Williams 在悉尼的大數(shù)據(jù)大會(huì)(Big Data Summit)上分享了公司的做法。
Ebay 網(wǎng)站有 1.8 億個(gè)活躍用戶。在任何一個(gè)給定的時(shí)刻,都會(huì)有 3.5 億左右的商品被銷售。Ebay 的拍賣搜索引擎上,每天會(huì)產(chǎn)生 2.5 億次搜索。Hugh Williams 說(shuō),公司在 Hadoop 集群和 Teradata 服務(wù)器上擁有的原始數(shù)據(jù)是 10 PB。通過(guò)對(duì)這些數(shù)據(jù)的利用,公司可以提高在線的交易量,引導(dǎo)用戶購(gòu)買更多商品。
Hugh Williams 主要談到了搜索引擎的優(yōu)化。通過(guò)對(duì)數(shù)據(jù)的分析,公司可以把握用戶的行為模式,從而優(yōu)化搜索結(jié)果。“如果將時(shí)間倒退幾年,你使用 Ebay 的搜索引擎時(shí),會(huì)發(fā)現(xiàn)它只理解字面意思”,Williams 說(shuō),“你可以在搜索引擎輸入文字,它將按照字面含義尋找,但是并不能真正理解你想法的深層含義”。
現(xiàn)在,Ebay 要使搜索引擎更加“直覺(jué)化”。例入,Ebay 發(fā)現(xiàn),那些想要購(gòu)買 Pilzlampe 的用戶,如果他們輸入了“Pilz lampe“的話,更有可能購(gòu)買商品,因?yàn)樗阉饕鏁?huì)給出更多結(jié)果,因此,搜索引擎通過(guò)在單詞中增加一個(gè)空格,就可以增加在線交易量。
Ebay 會(huì)根據(jù)自己掌握的信息,改變或重寫用戶的搜索請(qǐng)求,增加同義詞或者替換語(yǔ)句,從而給出更具相關(guān)性的結(jié)果。另外,Ebay 還通過(guò)大數(shù)據(jù)來(lái)預(yù)測(cè)商品是否銷售出去,銷量會(huì)是多少,然后調(diào)整商品在搜索引擎上的排名。
Williams 說(shuō),增加因素來(lái)改變搜索結(jié)果是有風(fēng)險(xiǎn)的。公司通常需要幾個(gè)月來(lái)增加一項(xiàng)因素,而且他們不知道是否真的對(duì)用戶有用。為此,Ebay 會(huì)在一小部分用戶那里進(jìn)行測(cè)試,然后觀察他們的反應(yīng)。
改善搜索引擎的過(guò)程中,對(duì)用戶搜索請(qǐng)求的情景判斷是一個(gè)挑戰(zhàn)。比如用戶在搜索“吉朗貓球隊(duì)(Geelong Cats)”的時(shí)候,搜索引擎可能會(huì)把“貓”做為關(guān)鍵詞,然后搜索寵物這一類別,這對(duì)于用戶來(lái)說(shuō)是無(wú)用信息。“在我們這樣的大規(guī)模下,會(huì)發(fā)生很多微小的問(wèn)題,因此需要數(shù)據(jù)專家之類的人員來(lái)調(diào)查這些事情。”Williams 說(shuō)。