阿里巴巴:未來將是數(shù)據(jù)公司
很多行業(yè)都想借助大數(shù)據(jù)提高決策準(zhǔn)確度、提升業(yè)務(wù)水平,但首先遇到的問題便是數(shù)據(jù)量還不夠大。相比之下,有一些公司足可以稱得上是超級(jí)“大礦主”了,只是礦山性質(zhì)不同:百度擁有最大的網(wǎng)頁(yè)搜索數(shù)據(jù),阿里巴巴擁有最大的電商數(shù)據(jù),騰訊擁有最大的社交數(shù)據(jù)。
阿里巴巴集團(tuán)主席馬云在多個(gè)場(chǎng)合都表達(dá)過阿里巴巴的“三大戰(zhàn)略”,即平臺(tái)、金融、數(shù)據(jù),在他的計(jì)劃中,阿里巴巴最終將會(huì)是一個(gè)數(shù)據(jù)公司。
這一點(diǎn)從阿里最近幾年接二連三的大手筆并購(gòu)中已經(jīng)初見端倪:新浪微博、陌陌帶來的社交數(shù)據(jù),高德帶來的地理數(shù)據(jù),UC瀏覽器帶來的移動(dòng)瀏覽數(shù)據(jù),蝦米帶來的音樂數(shù)據(jù),還有墨跡天氣、友盟、美團(tuán)……這些幾乎涵蓋了人們互聯(lián)網(wǎng)生活的方方面面。再加上阿里巴巴原本擁有交易數(shù)據(jù)和信用數(shù)據(jù),儼然一張讓人充滿無限遐想的“大數(shù)據(jù)拼圖”。
2012年,阿里巴巴設(shè)立的首席數(shù)據(jù)官(CDO),由后來接任馬云擔(dān)任CEO的陸兆禧擔(dān)任。在今年年初,阿里巴巴在進(jìn)行公司架構(gòu)戰(zhàn)略調(diào)整時(shí),又專門成立了數(shù)據(jù)委員會(huì),“這個(gè)部門會(huì)為阿里集團(tuán)所有事業(yè)部提供數(shù)據(jù)支持?!卑⒗锇桶图瘓F(tuán)數(shù)據(jù)委員會(huì)首任會(huì)長(zhǎng)車品覺告訴《中國(guó)經(jīng)濟(jì)周刊》,這位大半生癡迷于數(shù)據(jù)的香港人肩負(fù)著為阿里巴巴尋找開啟大數(shù)據(jù)之門鑰匙的重任。
據(jù)車品覺介紹,淘寶的“千人千面”計(jì)劃是電商大數(shù)據(jù)最突出的代表,通過數(shù)據(jù)挖掘?qū)崿F(xiàn)精準(zhǔn)化的營(yíng)銷和產(chǎn)品推送。同時(shí),阿里金融也是大數(shù)據(jù)衍生產(chǎn)品開發(fā)的一個(gè)范例,利用云計(jì)算和大數(shù)據(jù)的技術(shù)和思想,阿里金融實(shí)現(xiàn)了高效和創(chuàng)新。
9月,阿里巴巴先后與中國(guó)電信、民生銀行合作,聯(lián)手鏖戰(zhàn)大數(shù)據(jù)平臺(tái)。憑借大數(shù)據(jù)優(yōu)勢(shì),阿里巴巴再次加重了其在云計(jì)算、互聯(lián)網(wǎng)金融上的砝碼。
“數(shù)據(jù)是一種信仰?!避嚻酚X說。
百度:“深度學(xué)習(xí)”大數(shù)據(jù)
百度擁有中國(guó)最大的網(wǎng)民行為數(shù)據(jù)庫(kù),覆蓋95%的中國(guó)網(wǎng)民,日均響應(yīng)50億次搜索請(qǐng)求,搜索市場(chǎng)占比達(dá)80%,日處理數(shù)據(jù)量達(dá)100TB。同時(shí),百度還構(gòu)建了百度聯(lián)盟,60萬聯(lián)盟合作伙伴每天有50億次的日均行為產(chǎn)生,一起構(gòu)成了巨大的數(shù)據(jù)基礎(chǔ)。
數(shù)據(jù)規(guī)模越大,處理難度也越大,但對(duì)其進(jìn)行挖掘可能得到的價(jià)值更大。寶潔公司數(shù)字媒體與創(chuàng)新平臺(tái)經(jīng)營(yíng)部市場(chǎng)總監(jiān)陳萬峰回憶,2012年百度幫助寶潔對(duì)旗下重點(diǎn)品牌“玉蘭油”做了一次大數(shù)據(jù)分析,結(jié)果發(fā)現(xiàn)與其他競(jìng)爭(zhēng)品牌相比,消費(fèi)者在“玉蘭油”關(guān)鍵詞后跟著“適合幾歲”的比例明顯偏高,這意味著玉蘭油的年齡定位比較模糊。為此,寶潔及時(shí)調(diào)整了營(yíng)銷策略,還順勢(shì)推出了一款針對(duì)25歲人群的細(xì)分產(chǎn)品,結(jié)果市場(chǎng)反響非常好。
當(dāng)然,這只是百度大數(shù)據(jù)的初級(jí)夢(mèng)想。百度魔圖推出的“PK大咖”功能成為時(shí)下最為流行的App(應(yīng)用),上線10天便成為蘋果iOS免費(fèi)應(yīng)用的首位,它能夠幫你找到和你最像的明星,這背后其實(shí)就是百度對(duì)圖像識(shí)別的階段性成果,即超越文字搜索的多媒體搜索,包括語(yǔ)音、圖像和視頻等。
余凱是百度技術(shù)副總監(jiān)、多媒體部負(fù)責(zé)人,中組部“千人計(jì)劃”國(guó)家特聘專家。多媒體部門是去年百度新成立的部門,這位曾在NEC美國(guó)研究院擔(dān)任研究部門主管和在斯坦福大學(xué)執(zhí)教人工智能課程的數(shù)據(jù)科學(xué)家,現(xiàn)在主要帶領(lǐng)整個(gè)部門從事語(yǔ)音、圖像等方面的研究,這些都是未來大數(shù)據(jù)重要應(yīng)用,而語(yǔ)音、圖像和視頻都是非結(jié)構(gòu)化數(shù)據(jù),處理和分析難度更高,但非結(jié)構(gòu)化數(shù)據(jù)將是未來大數(shù)據(jù)的主流。
今年年初,李彥宏成立了深度學(xué)習(xí)研究院(Institute of Deep Learning)并親自任院長(zhǎng),還親自出馬去招攬人才,而這一切目的是通過大數(shù)據(jù)“深度學(xué)習(xí)”出互聯(lián)網(wǎng)的未來。
“我們目前最關(guān)注的是大幅度提高語(yǔ)音識(shí)別的準(zhǔn)確率,把圖像、視覺搜索變?yōu)榭赡??!庇鄤P告訴《中國(guó)經(jīng)濟(jì)周刊》,“深度學(xué)習(xí)是模擬人腦神經(jīng)元的機(jī)制,我們希望利用它實(shí)現(xiàn)人工智能的夢(mèng)想,業(yè)界頂尖公司達(dá)成了一個(gè)共識(shí):大數(shù)據(jù)+深度學(xué)習(xí)缺一不可。我們有海量數(shù)據(jù),里面有豐富信息,用一個(gè)簡(jiǎn)單模型不足以把豐富信息提取出來,所以我們要用深度學(xué)習(xí)模型,把里面數(shù)據(jù)的價(jià)值給找出來。”