為推動這個數(shù)據(jù)新世界早日到來,從產(chǎn)業(yè)創(chuàng)新和行業(yè)應(yīng)用角度推動大數(shù)據(jù)落地,2013中關(guān)村大數(shù)據(jù)日于12月13日在中關(guān)村云廣場酒店隆重開幕!給我們打開如何看待和融入大數(shù)據(jù)時代的“新視界”。大會通過搭建大數(shù)據(jù)領(lǐng)域內(nèi)高端、專業(yè)交流溝通平臺,圍繞全球大數(shù)據(jù)發(fā)展趨勢與應(yīng)用實(shí)踐、探討中國大數(shù)據(jù)發(fā)展現(xiàn)狀和未來、中國大數(shù)據(jù)道路探索與階段性成果、以及產(chǎn)業(yè)政策、資本市場對大數(shù)據(jù)關(guān)注焦點(diǎn)等核心問題,廣泛邀請全球技術(shù)創(chuàng)新者、應(yīng)用實(shí)踐者、政策制定者和資本推動者共同參與,為中國大數(shù)據(jù)建設(shè)培植良好的產(chǎn)業(yè)氛圍和發(fā)展環(huán)境,思想云集,創(chuàng)意云聚。
《大數(shù)據(jù)的云圖》的作者大衛(wèi)·芬雷布在2013中關(guān)村大數(shù)據(jù)日做了精彩分享。他認(rèn)為下一個獲得重大發(fā)展的是在應(yīng)用領(lǐng)域,這個領(lǐng)域通過各種技術(shù)的手段,能夠真正的把數(shù)據(jù)變成生產(chǎn)力。過去的幾年中,大部分的投資都是在數(shù)據(jù)基礎(chǔ)設(shè)施方面,未來我們會看到在應(yīng)用層有更大的發(fā)展。
大衛(wèi)·芬雷布:早上好,很高興認(rèn)識你們!今天我會講一些關(guān)于大數(shù)據(jù)方面最新的一些趨勢和發(fā)展,以及一些有趣的公司。首先要知道什么叫大數(shù)據(jù)?看來大家對大數(shù)據(jù)有所了解,我在這里面可以講一些。在進(jìn)入大數(shù)據(jù)相對嚴(yán)肅的商業(yè)考評之前,我揮介紹一下我自己生活中的大數(shù)據(jù)。
這張圖片,是在法國鐵人三項(xiàng)的比賽開始的起點(diǎn),對鐵人三項(xiàng)的賽事大家都了解,是游泳、騎車、跑步三項(xiàng)。有人喜歡在中國打高爾夫球,但是鐵人三項(xiàng)是我的愛好,目前我已經(jīng)完成了鐵人三項(xiàng)。你沒有太關(guān)注的是這些運(yùn)動員,實(shí)際上是世界上產(chǎn)生運(yùn)動數(shù)據(jù)最多的類型之一。
通過技術(shù)手段,現(xiàn)在運(yùn)動員在整個運(yùn)動的過程中產(chǎn)生的數(shù)據(jù),我們都可以進(jìn)行搜集和分析,這里面包括了運(yùn)動過程中的熱量、心率,都可以搜集和分析。這項(xiàng)運(yùn)動我覺得很有意思的原因,是我結(jié)合了三項(xiàng)關(guān)于大數(shù)據(jù)很重要的特點(diǎn)。
首先就是我們可以通過非常廉價的技術(shù)產(chǎn)品,獲取整個運(yùn)動中的數(shù)據(jù)。比如現(xiàn)在展示了一個很普通的運(yùn)動手表,可以幫助我們記錄所有的運(yùn)動過程中的心率、運(yùn)動的軌跡,跑的長度等。
第二、在這個過程中產(chǎn)生的數(shù)據(jù)量非常的驚人,我們在這里面看到,通過手表的記錄服務(wù),現(xiàn)在已經(jīng)累計記錄超過了40億英里的運(yùn)動數(shù)據(jù)。
第三、這些數(shù)據(jù)都是存在云端,所以在這一個簡單的運(yùn)動過程中。很好的體現(xiàn)了大數(shù)據(jù)的很多特點(diǎn)。通過一個便宜的設(shè)備,搜集很多的數(shù)據(jù),并且把這個數(shù)據(jù)存到云端加以分析,在這個鐵人三項(xiàng)的運(yùn)動中都有體現(xiàn)。
大數(shù)據(jù)并不僅僅是一個商業(yè)的概念,而是觸及到我們生活的點(diǎn)點(diǎn)滴滴。我們下面會重點(diǎn)的介紹一下大數(shù)據(jù)在各個方面如何影響我的生活?大家有沒有人想去跑一次鐵人三項(xiàng)?或者是馬拉松?我覺得跑馬拉松是很好的把生活和大數(shù)據(jù)相結(jié)合的運(yùn)動。
這張就是著名的大數(shù)據(jù)藍(lán)圖,在行業(yè)中也被使用了數(shù)十萬次,包括很多的領(lǐng)先的企業(yè),包括VMware和英特爾,曾經(jīng)都使用過這張圖。這張圖分成兩個部分,下面的部分是大數(shù)據(jù)的基礎(chǔ)設(shè)施部分。這一部分的數(shù)據(jù)如何存儲在云端。上面部分是應(yīng)用的部分,是我們?nèi)绾瓮ㄟ^技術(shù)的手段,使用和分析這些數(shù)據(jù)。
在過去的幾年中,VC的風(fēng)險投資者主要集中在下面一部分,就是數(shù)據(jù)基礎(chǔ)的設(shè)施,大部分都集中在數(shù)據(jù)存儲方面。同時我之前的公司也是在做這個,去年被EMC收購了。我覺得下一個獲得重大發(fā)展的是在應(yīng)用領(lǐng)域,這個領(lǐng)域通過各種技術(shù)的手段,能夠真正的把數(shù)據(jù)變成生產(chǎn)力。在應(yīng)用領(lǐng)域,有一些比較有意思的公司。比如說(sblog),這個公司去年上市,現(xiàn)在市值超過70億美金。
在第一版的大數(shù)據(jù)藍(lán)圖里面,只有30多家。隨著時間的推進(jìn),公司會越來越多,下一個周期可能有更多的創(chuàng)業(yè)公司放在這個藍(lán)圖上面。總結(jié)一下在這張圖上,我們看到過去的幾年中,大部分的投資都是在數(shù)據(jù)基礎(chǔ)設(shè)施方面,未來我們會看到在應(yīng)用層有更大的發(fā)展。
下面舉一些大數(shù)據(jù)真正在商業(yè)中的應(yīng)用實(shí)例,最重要的就是在電子商務(wù)領(lǐng)域。在美國最大的電商是亞馬遜,在中國是淘寶,這些電商公司,他們擁有非常多的用戶在網(wǎng)上進(jìn)行購買和交易的數(shù)據(jù),他們對于自己客戶的了解是相對于傳統(tǒng)的零售業(yè)有很多的優(yōu)勢和認(rèn)知。
第二、金融領(lǐng)域,如果你是一個創(chuàng)業(yè)者,金融領(lǐng)域是一個很好的創(chuàng)業(yè)的方向。因?yàn)樵谶@個領(lǐng)域你的客戶都是一些非常有實(shí)力的銀行機(jī)構(gòu),而他們也在大數(shù)據(jù)方面投入了跟多。
第三、城市交通領(lǐng)域。在美國有一個很有意思的公司叫(ubei),它主要是在智能車領(lǐng)域做了創(chuàng)新,現(xiàn)在公司已經(jīng)超過了數(shù)億美金。(ubei)就是把移動客戶端、大數(shù)據(jù)、云這些概念結(jié)合到一起,通過結(jié)合租車的用戶,和租車的實(shí)時的路況信息,是一個非常有意思的租車的應(yīng)用。
相信大家都有非常多不好的電話客服的經(jīng)歷,圖上這個人就是電話客服幫助他恢復(fù)互聯(lián)網(wǎng)服務(wù)過程中的表情。但是通過大數(shù)據(jù)的分析,我們就可以知道通過什么樣的方式,可以提高客服的服務(wù)水平,使我們的客戶更加滿意。在美國有一家叫做(zdesk)的公司,他們通過分析得出結(jié)論,如何讓客戶在客服服務(wù)上更滿意。結(jié)論首要的因素,就是如何更快的回復(fù)你的客戶。
線上營銷也是很好的應(yīng)用大數(shù)據(jù)的領(lǐng)域,傳統(tǒng)的營銷方式,我們很清楚,有一半的營銷預(yù)算是被浪費(fèi)掉了,我們并不知道是怎么被浪費(fèi)掉了?,F(xiàn)在通過多個渠道的數(shù)據(jù)來源,我們可以更有效的分析我們的營銷的預(yù)算是如何被花出去了,在哪個渠道最有效,哪個客戶最有可能轉(zhuǎn)為后備客戶。
再就是之前提到的身體健康領(lǐng)域,在醫(yī)療健康方面,我們現(xiàn)在有很多創(chuàng)新的應(yīng)用,可以幫助我們很好的了解自己的身體,幫助我們更好的提高身體的素質(zhì)。
教育領(lǐng)域,傳統(tǒng)都是通過書本簡單的學(xué)習(xí)。在未來我們會通過移動終端結(jié)合大數(shù)據(jù)分析的模式,使得整個個人教育的體驗(yàn),能夠更加的有互動性,更加的個性化。
在美國在大數(shù)據(jù)領(lǐng)域方面最成功的三家公司就是谷歌、亞馬遜和facebook,下面我們討論一下這三家公司在大數(shù)據(jù)方面成功的案例。
這個統(tǒng)計是在今年的夏天,在北美全部的互聯(lián)網(wǎng)流量當(dāng)中,有62.28%流量是通過谷歌。可能大家都普遍的認(rèn)為,谷歌是一個消費(fèi)者很多的公司,但是通過這個數(shù)據(jù)我們可以看到,谷歌真的是一個大數(shù)據(jù)公司。我們更具體的說一下這些數(shù)據(jù),谷歌每年處理將近兩萬億的搜索需求。同時谷歌還會處理很多的原數(shù)據(jù),這些原數(shù)據(jù)不光是用戶搜索的東西,而是數(shù)據(jù)跟數(shù)據(jù)之間的關(guān)系。
同時谷歌發(fā)明了很多的技術(shù),也是現(xiàn)在在大數(shù)據(jù)開源領(lǐng)域最重要的一些技術(shù)。正是像谷歌這類的公司,之前從來沒有像他們這么廣泛的觸及到消費(fèi)者,產(chǎn)生這么大數(shù)據(jù)的公司,所以他們很多的技術(shù)都要靠自己去發(fā)明,去處理如此大的數(shù)據(jù)量。其中最著名的技術(shù)就是hadoop,hadoop就是用來存儲大量數(shù)據(jù)的存儲技術(shù)。
不光是有很多人產(chǎn)生的數(shù)據(jù),同時還有很多的機(jī)器產(chǎn)生的數(shù)據(jù)。同時在谷歌工作的員工,也是世界上最聰明的一些人。所以當(dāng)你擁有很多很聰明,很有才干的人,再加上你擁有世界上最大的數(shù)據(jù),在這里面就誕生了很多大數(shù)據(jù)方面的創(chuàng)新和技術(shù)。
第二個很有意思的案例,就是亞馬遜,現(xiàn)在預(yù)測亞馬遜在2015年的銷售額,將超過一千億美金。我們比較這三家網(wǎng)站,谷歌知道你想搜索什么,亞馬遜知道你想買什么?facebook知道你喜歡什么?正如之前所言,亞馬遜和阿里巴巴這樣大型的電子商務(wù)網(wǎng)站,有非常多的交易數(shù)據(jù),他們更了解你想買什么東西。這樣可以幫助他們更好的優(yōu)化庫存管理和定價機(jī)制,使得他們的銷售更貼近消費(fèi)者。
亞馬遜很有意思的一個特點(diǎn)就是他們很注重數(shù)據(jù)分析。從最高層的CEO,到下面工作的人員,每個人都很強(qiáng)調(diào)用數(shù)據(jù)提升他們的工作效率。這也是我覺得大數(shù)據(jù)很有意思的一個特點(diǎn),就是越來越多的公司,都會通過數(shù)據(jù)的方式來提升生產(chǎn)力,提升工作的效率。
下一個亞馬遜重點(diǎn)的發(fā)力方向,就是在移動端,通過把越來越多的移動端放到消費(fèi)者的手里,更好的了解消費(fèi)者在移動端和各個場景中的消費(fèi)習(xí)慣。我覺得在未來幾年中,大數(shù)據(jù)與移動端、與云的結(jié)合,將是非常有發(fā)展的方向,會有更多的新的創(chuàng)業(yè)者在這個方向,在大數(shù)據(jù)和其他領(lǐng)域結(jié)合方面開拓創(chuàng)新的企業(yè)。除了電商服務(wù),亞馬遜有亞馬遜云服務(wù),在過去幾年獲得非常快的發(fā)展,現(xiàn)在銷售額已經(jīng)接近20億美金。
這也是我覺得大型消費(fèi)類公司的一個重要發(fā)展方向,通過開放他們自己非常巨大的基礎(chǔ)設(shè)施,讓第三方的開發(fā)者能夠在上面開發(fā)和運(yùn)營他們的應(yīng)用。比較有意思的是亞馬遜自己也有類似的服務(wù),叫亞馬遜視頻,通過這樣的服務(wù),用戶也可以在家觀看各種電視、電影服務(wù)。即便如此,(nafles),它還是選擇在亞馬遜上架他們的云服務(wù),可見亞馬遜的云服務(wù),在使用效率上有多少大的吸引力。
下一張圖是facebook的用戶增長,我們可以看到facebook的用書數(shù)已經(jīng)快趕上中國的人口數(shù)了,已經(jīng)超過了10億。facebook也是自己建立了一套自有的大數(shù)據(jù)系統(tǒng),用來分析這10億用戶的用戶行為。這三個案例很重要的一點(diǎn)就是越來越多的大型公司都要利用數(shù)據(jù)更好的分析他們的業(yè)務(wù),更好的為業(yè)務(wù)提供支持。這些并不僅僅是很有意思的消費(fèi)的公司,他們真的是大數(shù)據(jù)公司。
下面我們重點(diǎn)的來談一下在大數(shù)據(jù)領(lǐng)域的創(chuàng)新,如何在這個領(lǐng)域創(chuàng)業(yè),以及投資的情況。在場大家有沒有玩電子游戲的?在電玩領(lǐng)域,魔獸世界這個游戲,僅存儲用戶游玩的數(shù)字就1.3PB。因?yàn)槿绱舜蟮臄?shù)據(jù)量,我們可以預(yù)測越來越多產(chǎn)生大數(shù)據(jù)的服務(wù)和產(chǎn)品,都會需要更好的大數(shù)據(jù)分析的技術(shù)。所以在這個領(lǐng)域,是創(chuàng)業(yè)非常有前景的方向,同時也是VC和風(fēng)險投資需要重點(diǎn)關(guān)注的領(lǐng)域。
下面一個例子,是我們?nèi)绾握嬲脑谏钪惺褂么髷?shù)據(jù)。很多的科學(xué)家在分析facebook上面,大家貼上了很多的狀態(tài)的信息。通過這些數(shù)據(jù),科學(xué)家實(shí)際上可以分析或者是預(yù)測男女朋友什么時候會分手?在美國,這個分手高峰期,正是在現(xiàn)在的時間,就是在圣誕節(jié)的兩周之前。在中國我們的高峰會來的晚一點(diǎn)。
總結(jié)下來我們看到了很多在大數(shù)據(jù)領(lǐng)域非常有意思的實(shí)際的應(yīng)用。在這個領(lǐng)域發(fā)展和創(chuàng)新的速度也是非??斓?,我們知道之前大數(shù)據(jù)藍(lán)圖上面最早的一版是數(shù)十家公司,現(xiàn)在已經(jīng)有非常多的公司。在這樣的一個活躍的領(lǐng)域,我們也會看到越來越多的并購和上市的案例。除了之前看到的很多大公司的案例,我們也看到了很多的小型的創(chuàng)業(yè)公司,也可以在這個領(lǐng)域獲得很大的發(fā)展。這是非常令人振奮的領(lǐng)域,我在這個領(lǐng)域有一本著作,叫《大數(shù)據(jù)云圖》希望大家可以閱讀。感謝田總和各位同事邀請我來參加大數(shù)據(jù)的論壇。謝謝。