關(guān)于“大數(shù)據(jù)”你一定聽濫了,但也沒搞明白究竟是怎么回事。盡管你無時無刻不在感受到它帶來的“某些”便利:
比如一周前你在某個社交網(wǎng)站上做面試測試題,當(dāng)你面試完時才知道,那份測試題真正的意圖是匹配你與團(tuán)隊性格的契合度有多高。又如,在十一黃金周前你接到某個購票應(yīng)用推送的信息,上面提示你提前16天通過電話訂火車票,要比同日在網(wǎng)上購票成功機(jī)率高。當(dāng)你真的打過去時,發(fā)現(xiàn)電話預(yù)訂系統(tǒng)正處于繁忙狀態(tài),而不得不等了2小時后再致電,才訂票成功。但好過同一時刻被卡在12306網(wǎng)站上而付不了款。
大數(shù)據(jù)正在滲透各行各業(yè),甚至能跟你考試能力測試、患上某種疾病的機(jī)率等非常生活化的場景應(yīng)用都發(fā)生緊密的聯(lián)系。今后大數(shù)據(jù)在我們的生活中就像是水和電一樣,讓社會整個信息質(zhì)量更好、讓信息利用效率更高效。
在這個系統(tǒng)中,數(shù)據(jù)的采樣與后期分析仍需要靠人為力量去完成。
眾包讓數(shù)據(jù)采樣更自動化
“今后人工干預(yù)會越來越不必要,至少在前端采集數(shù)據(jù)是這樣。”產(chǎn)品經(jīng)理James向騰訊科技談到,現(xiàn)在很多數(shù)據(jù)的采集都來自與用戶的交互行為,比如搜索、微博互動、又比如“喜歡”、“贊”、“丟掉廢紙簍”這類在應(yīng)用中小的設(shè)計,只要用戶主動完成,在后臺便可推算出數(shù)據(jù)質(zhì)量。
洋蔥價格的高漲起落決定了印度通貨膨脹率的趨勢,一家名為Premise的創(chuàng)業(yè)公司,每天通過700多個安裝了自己開發(fā)應(yīng)用的用戶來實(shí)時上傳各地區(qū)的不同洋蔥零售價格。
該公司的聯(lián)合創(chuàng)始人大衛(wèi)-斯洛夫(David Soloff)認(rèn)為,這是一種能夠?qū)崟r感知全球金融動態(tài)的有效渠道,因?yàn)楫?dāng)?shù)厣痰暌话愣紩鶕?jù)經(jīng)濟(jì)環(huán)境的變化(其中包括批發(fā)價格和消費(fèi)者信心等因素)及時調(diào)整商品售價。
“Premise所提出的分析方法已經(jīng)證明,根據(jù)自己所收集的數(shù)據(jù)在部分經(jīng)濟(jì)環(huán)境中提前4-6周給出通脹指標(biāo)預(yù)測。大家完全不必再等待此前那種每月一次的‘經(jīng)濟(jì)天氣預(yù)報’了。”斯洛夫強(qiáng)調(diào)。
而對零售門店來說,貨架上品牌的陳列直接決定著銷量,如何讓品牌在流動的顧客中一直占據(jù)較好的陳列位置,讓這項工作既需要耗時耗力,也非?,嵥?。
為此一家名為Quri的公司,通過開發(fā)一款名為EasyShift的應(yīng)用,讓用戶有償貢獻(xiàn)時間去精力去完成這項數(shù)據(jù)的收集。用戶只要領(lǐng)取應(yīng)用下達(dá)的任務(wù),在指定的地點(diǎn)拍指定場所的照片,上傳到Quri的服務(wù)器上,便可領(lǐng)取相應(yīng)微薄的報酬。
EasyShift的理念不難理解:現(xiàn)在大多數(shù)用戶都隨身攜帶智能手機(jī)。品牌商想要了解自己的商品在大型零售店的展示情況、評估競爭對手的動態(tài)、報告斷貨的產(chǎn)品和定價信息、監(jiān)測促銷和產(chǎn)品發(fā)布情況。EasyShift向消費(fèi)者付費(fèi),讓他們在購物時順手收集這些信息。
在日本大地震中,意外地運(yùn)用了某汽車品牌車載導(dǎo)航實(shí)時的可視化數(shù)據(jù),打通“綠色生命通道”的項目“連接生命線”。
該項目負(fù)責(zé)人菅野熏是日本電通創(chuàng)意設(shè)計中心高級總監(jiān),在日本大地震前他接受了某汽車品牌的合作項目。該項目為在某路段行駛了哪一輛車,什么時間行駛,位于哪個經(jīng)緯度,以多快的速度朝哪個方向行駛等,每分鐘大約有十萬條的動態(tài)數(shù)據(jù)都會記錄在一個車載導(dǎo)航數(shù)據(jù)庫中,菅野熏將這些數(shù)據(jù)集成一個程序內(nèi),并以日本地圖的形式展現(xiàn)出來。
在日本發(fā)生地震時,這些導(dǎo)航數(shù)據(jù)都能臨時派上用場。
“地震時,通訊信號都不太暢通,人們只能夠通過網(wǎng)絡(luò)確認(rèn)親人朋友是否平安,我們所面臨的挑戰(zhàn)就是如何將救援隊去送往災(zāi)區(qū)。”菅野熏說道。
導(dǎo)航數(shù)據(jù)本來用于交通擁堵情況而搜集車輛的行駛數(shù)據(jù)。“從另一個角度來說,有車輛行駛的數(shù)據(jù)說明,道路是可通過的。”菅野熏談到,地震后一旦有車輛行駛,就用綠色去進(jìn)行標(biāo)注,形成一條通行軌跡。
與此同時,團(tuán)隊還在Twitter上實(shí)時組織用戶去發(fā)布目前全日本各地路況與路標(biāo)信息,綜合兩類信息后,將綠色生命通道數(shù)據(jù)于地震發(fā)生20個小時后發(fā)布在網(wǎng)上公開下載。除了網(wǎng)頁端外,編程人員也快速開發(fā)了移動端。在當(dāng)時的危機(jī)之下,信息擴(kuò)散的力度是極快的,很快在在網(wǎng)站和手機(jī)應(yīng)用中,多條綠色的線路都逐一呈現(xiàn),為救援隊快速到達(dá)提供了參考。