萬昊認為,大數據并不必然就一定有效果。除非人們能從中發(fā)現有用的信息和規(guī)律,這才是大數據真正重要的地方。傳統(tǒng)營銷中人群定向是一種退而求其次的方法,廣告主直接找到他的核心或潛在用戶才是最直接的。而京東大數據就可以實現這種直接的定向,比如定向看過或買過指定商品的、指定品牌和店鋪的用戶。
京東怎么知道用戶在京東的體驗得到滿足了呢?這也有可以量化的指標衡量:用戶購買的商品總額和商品數。京東廣告將此兩個指標作為主要優(yōu)化目標,實現的方法是大規(guī)模機器學習、標簽標引。
萬昊說,京東的搜索廣告和推薦位廣告是一套架構。同一個廣告單元,可以有兩種定向:購物行為定向和搜索定向,排序根據質量因子×出價決定。所謂質量因子就是機器學習模型起效的地方,比如用戶看了兩個商品,卻只買了其中一個,肯定是對一個感興趣,對另一個興趣不大。京東廣告使用深度學習技術來預估用戶的興趣,根據結果選擇讓何種廣告處在更顯眼的位置上。這樣,用戶買到了他想買的東西,廣告商推廣賣出了自己的東西,京東幫助用戶選到了心儀的商品,同時也從廣告商那收到了廣告費,達到三贏的狀態(tài)。
杜宇甫:構建大數據生態(tài)環(huán)境京東集團云平臺數據首席架構師杜宇甫發(fā)表了題為《構建大數據生態(tài)環(huán)境》的主題演講,他的演講內容包括大數據的產生歷史,大數據的分析過程以及對于大數據生態(tài)的思考。
杜宇甫表示:生態(tài)的意義在于整個系統(tǒng)中包含了數據的生產者、分解者和消費者。每次信息革命,人類的數據都在不斷增大,當“互聯網+信息”爆發(fā)的時候也即是人類進入大數據時代的開端。杜宇甫將大數據生態(tài)分為:數據收集、數據存儲、數據建模和分析、數據應用五個階段。五個階段環(huán)環(huán)相扣,讓數據在生態(tài)中進行自主運轉。
杜宇甫認為,消費不足并不是因為需求不足,而是由于產能供給不足,只有創(chuàng)新才能激發(fā)新的消費空間。
針對創(chuàng)新激發(fā)需求這個問題,京東建立了數據云平臺,目的是想建立一個大的數據生態(tài)環(huán)境,讓數據能在這個生態(tài)中循環(huán)起來。在這個生態(tài)里,任何一個人,在任何一個環(huán)節(jié)上都能夠用起來,玩起來。“當用戶數據不足,無法用于決策和優(yōu)化推廣的時候,我們可以為用戶提供咨詢服務,幫用戶做數據收集;我們也有數據市場(京東萬象數據開放平臺)可以進行數據共享和交易;如果用戶不懂數據價值,我們可以提供數據專家?guī)椭脩敉诰騼r值;如果用戶無法支持海量數據分析,我們可以提供分布式數據集群,硬件和軟件資源幫用戶處理數據;在上層我們提供數據生成工具,把整個數據環(huán)節(jié)串聯起來,最終幫用戶將數據變現和產生更多商業(yè)價值。數據的交易和增值,開放和共享不僅給企業(yè)自身帶來價值,同時也會為其他的企業(yè)和整個社會帶來積極的影響。”
京東數據云生態(tài)包含:數據采集工具、離線+流式數據分析平臺(BDS:Big Data Service)、實時數據分析平臺(RAS:Real-time Analytic Service)、數據集成平臺(DAG:Data API Gateway)、數據交易平臺(萬象),以及云海數據。為用戶提供咨詢服務、數據專家、數據分析能力、數據開放支持、數據增值服務等全業(yè)務線解決方案。京東數據云依托京東基礎云穩(wěn)定強大的IAAS底層服務系統(tǒng),在基礎云之上架設了數據云生態(tài)系統(tǒng),值得用戶信賴。
京東的精彩分享引發(fā)了大數據技術大會與會者的強烈關注,也成為現場互動最為熱烈的幾個場次。業(yè)界人士認為,京東的大數據技術分享務實而前瞻,體現了京東在電商技術和大數據應用領域的行業(yè)領袖地位以及技術對推動京東高速成長的顯著貢獻,其對先進技術的應用和緊貼業(yè)務發(fā)展的實踐為行業(yè)提供了非常有價值的參考,對提升互聯網行業(yè)大數據應用水平起到了推動作用。