導(dǎo)讀:大數(shù)據(jù)技術(shù)在大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律的能力顯然為旅游業(yè)提供了很多機(jī)會,那些擁有大數(shù)據(jù)項(xiàng)目的企業(yè)能以一種全新的方式向消費(fèi)者銷售旅游產(chǎn)品。
如果你是Tnooz的忠實(shí)讀者,你肯定看到過關(guān)于大數(shù)據(jù)(Big Data)的潛力之類的文章。
但就像大多數(shù)不斷涌現(xiàn)的技術(shù)一樣,人們很困惑它真正意味著什么,它能夠帶來更好的客戶體驗(yàn),提升銷售嗎?
這篇文章只是拋磚引玉,分析了大數(shù)據(jù)未來在旅游業(yè)一些潛在的應(yīng)用:
大數(shù)據(jù)
“大數(shù)據(jù)”這個詞通常有幾種表達(dá)方式,其意義不言而喻。“大數(shù)據(jù)”意為大量的數(shù)據(jù),即在規(guī)模、工作量和總體成本方面都超越了普通數(shù)據(jù)庫的數(shù)據(jù)集,以及提取分析其中含義的技術(shù)。
那么我們會在旅游業(yè)哪些地方遇見大量的數(shù)據(jù)呢?
其中一個最好的例子就是在線旅行社的分析日志。多年來,分析工具讓旅游企業(yè)追蹤轉(zhuǎn)化率渠道、詳細(xì)的消費(fèi)者數(shù)據(jù)及其他相關(guān)信息,如哪些頁面的轉(zhuǎn)化率最高?哪些頁面的蹦失率最高等等。
然后這些分析報(bào)告被用于優(yōu)化網(wǎng)站以確保最高的轉(zhuǎn)化率。但在大數(shù)據(jù)的時代,旅游企業(yè)在收集并關(guān)注的數(shù)據(jù)比以往任何時候都多。
例如,某些網(wǎng)站還實(shí)時收集訪客具體的鼠標(biāo)頁面活動信息。
針對每位用戶自然生成了很多信息,使得旅游企業(yè)對于每位用戶在頁面上的行為有著獨(dú)到的理解。
在幾年前,要完成這樣的數(shù)據(jù)儲存量甚至比登天還難(因?yàn)榉浅0嘿F)。
如今,廉價(jià)的儲存方式逐漸流行起來,分布的文件系統(tǒng)使得數(shù)據(jù)可以在幾十甚至幾百臺電腦之間共享,因此實(shí)現(xiàn)了廉價(jià)有效的數(shù)據(jù)儲存。
隨著儲存技術(shù)的提高,儲存每個字節(jié)數(shù)據(jù)的成本將繼續(xù)下降。
大數(shù)據(jù)分析、MapReduce以及語義提取
擁有所有的數(shù)據(jù)固然很好,但是真正的價(jià)值依賴于語義提取功能。基于Google最初發(fā)明的技術(shù),大數(shù)據(jù)工具如MapReduce能輕易發(fā)現(xiàn)數(shù)據(jù)中的共同趨勢,以及與這些趨勢相對應(yīng)的行為。
舉個例子讓大家更容易理解:
想象一下,你有一份包含全世界所有酒店的Excel表格,你想從中發(fā)現(xiàn)那些被描述為“很棒!”的酒店。
原始數(shù)據(jù)看起來也許如下圖:
酒店名稱——描述
—————————–
A酒店 “糟糕的體驗(yàn)”
B酒店 “很棒的游泳池”
C酒店 “喜歡”
B酒店 “很棒的餐廳”
A酒店 “喜愛”
C酒店 “很棒的體驗(yàn)”
B酒店 “乏味”
這里只是列舉了其中幾條記錄,這份表格可能有幾百甚至幾千頁。
利用MapReduce,你可以編寫一個功能,找出符合條件的每家酒店名稱,并針對每家酒店整合出一組評論。
在上面例子中,“B酒店”出現(xiàn)了3次,因此Map功能可能創(chuàng)造以下信息集:
B酒店:‘很棒的游泳池’‘很棒的餐廳’‘乏味’
因此,Map功能幫我們發(fā)現(xiàn)B酒店的所有評論,但是這還不夠,我們還需要利用Reduce功能進(jìn)行下一步分析。
此項(xiàng)功可以幫助我們在Map創(chuàng)建的數(shù)據(jù)集基礎(chǔ)上進(jìn)行各種分析。在此例中,我們想要找到只含“很棒”這個詞的評論。Reduce功能會寫出如下電腦編碼:
“只要發(fā)現(xiàn)評論中含有很棒這個詞,內(nèi)部計(jì)數(shù)器就+1。”
內(nèi)部計(jì)數(shù)器通常會顯示得分,或者某個特定數(shù)據(jù)集中“很棒”這個詞的數(shù)量。在此例中,B酒店將排在首位(有兩個“很棒”),然后是C酒店,最后是A酒店。
因此在這個例子中我們得到了什么?我們在原始非結(jié)構(gòu)化的數(shù)據(jù)基礎(chǔ)上發(fā)現(xiàn)了共同點(diǎn),并且基于商業(yè)目的進(jìn)行分析。
盡管看似很簡單,但這就是MapReduce及相關(guān)技術(shù)的力量:提取隱藏在數(shù)據(jù)中的規(guī)律。
MapReduce的驚人之處在于它能夠?qū)?shù)以億計(jì)的數(shù)據(jù)信息進(jìn)行分析,然后發(fā)現(xiàn)其中的規(guī)律。
現(xiàn)在你能感受到這種潛力嗎?
旅游領(lǐng)域中大數(shù)據(jù)的狀態(tài)
大數(shù)據(jù)技術(shù)在大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律的能力顯然為旅游業(yè)提供了很多的機(jī)會,來重塑針對消費(fèi)者的營銷和銷售方式。
毋庸置疑,那些擁有大數(shù)據(jù)項(xiàng)目的企業(yè)能以一種全新的方式向消費(fèi)者銷售旅游產(chǎn)品。
目前在大數(shù)據(jù)儲存公司Acunu任職的Emmanuel Marchal對于旅游業(yè)大數(shù)據(jù)的狀態(tài)進(jìn)行了簡要的描述:
大數(shù)據(jù)應(yīng)用程序正在從分析階段向真正的個性化階段過渡。例如,真正的個性化是指,旅游網(wǎng)站能夠根據(jù)旅游者的具體需求、愛好和此前的購買行為,為不同的旅行者提供不同的酒店選擇,而不是基于旅行者的類別提供大眾化的選擇。
真正的個性化是主要的驅(qū)動力,是旅游業(yè)大數(shù)據(jù)的“重中之重”。
OTA和其他旅游企業(yè)應(yīng)該把大數(shù)據(jù)看成是“必須的”,而不是“可有可無”。
關(guān)于大數(shù)據(jù),2009年開始有人談?wù)摚?010年很多公司開始啟動大數(shù)據(jù)項(xiàng)目,2011年略見雛形,那么2012年會是廣泛實(shí)踐大數(shù)據(jù)項(xiàng)目的開端嗎?除了個性化之外,Hopper公司也在這方面努力嘗試,并且提供了另外一個典型的例子來證明大數(shù)據(jù)是如何服務(wù)消費(fèi)者的。
針對自然語言處理和地點(diǎn)相結(jié)合的數(shù)據(jù)的大規(guī)模分析使得“附近500美元以下的海濱度假酒店”這樣的搜索成為可能。盡管這需要技術(shù)整合,大數(shù)據(jù)處理應(yīng)用程序使得它們成為可能。
展望未來
雖然個性化是“重中之重”,旅游業(yè)中使用大數(shù)據(jù)的潛在用戶很多。
地理圍欄(請點(diǎn)擊此處注釋)技術(shù)出現(xiàn)了,此技術(shù)可用于監(jiān)測靠近一個特定的景點(diǎn)或商戶的旅行者。
最近推出的Foursquare Radar功能是這種應(yīng)用的一個很好的例子,在你希望到某地并進(jìn)行了設(shè)定之后,當(dāng)你在它附近時,你的手機(jī)就會自動提醒。
這項(xiàng)技術(shù)就是大數(shù)據(jù):通過你手機(jī)的GPS功能搜尋實(shí)時的地理位置信息,然后提醒你在某個特定區(qū)域。
這項(xiàng)功能可用于數(shù)以億計(jì)的消費(fèi)者,此過程中需要收集和處理的數(shù)據(jù)量在幾年前是無法想象的。
試想一下:每天有多少用戶使用GPS導(dǎo)航功能?地理圍欄技術(shù)對于營銷人員來說帶來的潛力是巨大的。
圖像數(shù)據(jù)處理技術(shù):每天在有幾十億張照片在互聯(lián)網(wǎng)上上傳,這代表著超大的容量。
圖片共享應(yīng)用程序(如Instagram)是與好友分享精彩瞬間的絕佳方式,但這些創(chuàng)業(yè)企業(yè)的真正價(jià)值在于他們在后臺收集的數(shù)據(jù)。每張圖片都含有大量的數(shù)據(jù),通過進(jìn)一步分析才能發(fā)現(xiàn)用戶的主要信息。
Color,這家備受爭議的創(chuàng)業(yè)企業(yè)在推出產(chǎn)品之前就獲得了天價(jià)的估值,他們希望去收集的數(shù)據(jù)的巨大潛力說服了投資者。
旅游業(yè)中,創(chuàng)業(yè)企業(yè)Jetpac已經(jīng)采用了圖像處理技術(shù),給社會旅游領(lǐng)域注入了不同的色彩。
近日被eBay 收購的創(chuàng)業(yè)企業(yè)Hunch也是在分散數(shù)據(jù)中發(fā)現(xiàn)規(guī)律的很好例子。
他們的API和某些公共測試工具讓每個人發(fā)現(xiàn)類似“40%喜歡斯巴魯汽車的人也喜歡入住五星級酒店”這樣的結(jié)論。(當(dāng)然這不是個實(shí)例)
盡管這種相關(guān)性看上去很可疑,但是想象一下當(dāng)你試圖針對旅行者進(jìn)行交叉營銷時,這樣的關(guān)聯(lián)性會多么有價(jià)值。
Taste Graphs將了解客戶的“某件事”變成同時了解“很多其他的事”。Taste Graphs應(yīng)用程序的使用在將來肯定會得到廣泛的應(yīng)用,從在線零售商到旅游業(yè)。
總之,大數(shù)據(jù)不是你可以從供應(yīng)商那里買到的驚奇魔術(shù)盒。
大數(shù)據(jù)是這樣一個概念,即我們每天產(chǎn)生的大量數(shù)據(jù),并且隨著技術(shù)應(yīng)用的發(fā)展,我們可以更好地出售產(chǎn)品及服務(wù)。
你準(zhǔn)備好了嗎?