在擁有如此多的數(shù)據(jù)以后,接下來我們面對的數(shù)據(jù)質量問題。
為了避免混亂,我們需要找到數(shù)據(jù)之間的關聯(lián)性。
舉個實際生活中的例子,大約20年前,亞馬遜剛成立時,杰夫·貝索斯讓50個書評員來為他賣書,他意識到不僅僅可以請人來寫書評,還可以用數(shù)據(jù)技術來提供圖書推薦。起初他使用的是小數(shù)據(jù),不是大數(shù)據(jù),把客戶進行分類,比如說有人對中國旅游或者是對園藝感興趣,系統(tǒng)會自動提供推薦。他的同事告訴他,剛剛開始使用這個數(shù)據(jù)推薦時,使用體驗并不好;在進一步分析后,亞馬遜決定不對人進行分類,而是對用戶的需求分類。這個做法做法非常成功,以至于到今天,推薦系統(tǒng)為亞馬遜帶去30%的銷售收入。
這就是數(shù)據(jù)收集和再處理。亞馬遜有交易數(shù)據(jù),每買一本書就是一個交易,然后對這個數(shù)據(jù)進行分析。但今天我們已不再滿足于交易數(shù)據(jù)了,轉而收集起溝通數(shù)據(jù)。你看了某一個書評、某一個交流會給商家更多的信息和細節(jié)。
同時,大數(shù)據(jù)也重構了傳統(tǒng)零售業(yè),是未來零售業(yè)變革的催化劑。比如使用谷歌眼鏡,消費者不需要屏幕了,因為下一代的眼鏡會更好地理解消費者看到什么,知道如何更好地抓住人們的視線。對于零售商而言,消費者眼中看到的信息是極具價值的資產。賣家就可以了解大家在看什么樣的廣告,什么樣的產品,在路過櫥窗時究竟看了一些什么。
數(shù)據(jù)的產生和收集本身并沒有直接產生服務,最具價值的部分在于:當這些數(shù)據(jù)在收集以后,會被用于不同的目的,數(shù)據(jù)被重新再次使用。
大數(shù)據(jù)的一大優(yōu)點就是數(shù)據(jù)可以被重復使用。比方說這家公司實時車輛交通數(shù)據(jù)采集商Inrix,該公司目前有1億個手機端用戶。Inrix可以幫助你開車,避開堵車,為司機呈現(xiàn)路的熱量圖,紅的就表面堵車。如果只提供數(shù)據(jù),這個產品沒什么特色,
但值得一提的是,Inrix并沒有用交警的數(shù)據(jù),這個軟件的每位用戶在使用過程中會給服務器發(fā)送實時數(shù)據(jù),比如走的多快,走到哪里,這樣每個客戶都是探測器。
這里還有更大的秘密,Inrix可以重復使用數(shù)據(jù)。比如它了解到周末堵車時,哪里有堵車哪里有更好的銷售,他們就可以把這樣的數(shù)據(jù)提供給投資公司,投資公司根據(jù)這些數(shù)據(jù)對零售業(yè)再投資,這樣的服務以前是從來不存在的。
那么,大數(shù)據(jù)可以如何為創(chuàng)新企業(yè)所用?
你覺得之前成立新公司需要大筆資金,但事實并非如此。Inrix一開始并沒有錢,如果你想在大數(shù)據(jù)時代獲得成功,你已經不需要大的生產基地,大的倉庫了。你只需數(shù)據(jù),只要擁有數(shù)據(jù),對其進行分析就可以了。有云存儲的話,這個成本就更低。Inrix在成立之初根本沒有服務器和電腦,他們只是租用了云服務,也不需要很多的啟動資金,他們只是有這樣一個產品想法。
大數(shù)據(jù)時代的思維方式是:每天早上起來想一下,這么多數(shù)據(jù)我能用來干什么,這些價值在哪里可以找到,能不能找到一個別人以前都沒有做過的事情。你的想法和思路,是最重要的資產。
大數(shù)據(jù)的思維方式也可以幫助政府為大家提供更好更有效的服務,好比說我們可以通過大數(shù)據(jù)來確定哪些地方會有火災。以前防火檢查員只有13%的時間可以準備預測,現(xiàn)在他們找到火災隱患的概率達到了70%,比以前提高了6倍。將效率提高6倍是一個巨大無比的進步,未來的公共服務業(yè)可以由此獲得更多便利。
Target是一家非常大的美國零售公司,他們已有大數(shù)據(jù)的分析。
有一天,一個電話打進來,是一位非常生氣的客戶,這個客戶說公司送給他17歲的女兒一個折扣券,這個產品是尿布或者是避孕藥,這位客戶說:“我17歲的女孩子根本不需要,我需要你來道歉?!睅滋煲院?,客戶自己跑來道歉,他說你說的很準,我的女兒真的懷孕了。因為懷孕的女性會有不同的生活習慣,會買不同的東西,我們自己有時候都不知道他們已經懷孕了,而Target反而知道了。
這家公司就用這些信息為客戶推薦產品,然后給折扣券。為什么要講這個例子呢?因為美國很多客戶感到緊張,Target有這樣的能力來了解他們的生活中究竟發(fā)生了一些什么。