近年來(lái),大數(shù)據(jù)旋風(fēng)以“迅雷不及掩耳之勢(shì)”席卷全球,不僅是信息領(lǐng)域,經(jīng)濟(jì)、政治、社會(huì)等諸多領(lǐng)域都“磨刀霍霍”向大數(shù)據(jù),準(zhǔn)備在其中逐得一席之地。然而,很多公司在邁入大數(shù)據(jù)領(lǐng)域后遭遇“滑鐵盧”。在此,本文盤點(diǎn)了一系列大數(shù)據(jù)失敗項(xiàng)目,深究其原因,具有警示意義。
對(duì)數(shù)據(jù)過(guò)于相信
2008年,Google第一次開始預(yù)測(cè)流感就取得了很好的效果,比美國(guó)疾病預(yù)防控制中心提前兩禮拜預(yù)測(cè)到了流感的爆發(fā)。但是,幾年之后,Google的預(yù)測(cè)比實(shí)際情況(由防控中心根據(jù)全美就診數(shù)據(jù)推算得出)高出了50%。媒體過(guò)于渲染了Google的成功,出于好奇目的而搜索相關(guān)關(guān)鍵詞的人越來(lái)越多,從而導(dǎo)致了數(shù)據(jù)的扭曲。
低估大數(shù)據(jù)復(fù)雜程度
在美國(guó)有幾個(gè)互聯(lián)網(wǎng)金融公司專做中小企業(yè)貸款。但是中小企業(yè)貸款涉及的數(shù)據(jù)更復(fù)雜,而
且中小企業(yè)涉及到整個(gè)行業(yè)非常特殊的一些數(shù)據(jù),比如非標(biāo)準(zhǔn)的財(cái)務(wù)報(bào)表和不同行業(yè)、不同范式的合同,他們沒(méi)有很專業(yè)的知識(shí),是很難理解或者很難有時(shí)間把它準(zhǔn)確挖掘出來(lái)。
當(dāng)時(shí)大數(shù)據(jù)團(tuán)隊(duì)想用一個(gè)很完美的模型把所有的問(wèn)題都解決掉,比如把市場(chǎng)和信貸的解決方案全部用一個(gè)模型來(lái)解決,但因?yàn)閿?shù)據(jù)的復(fù)雜程度,最后證明這種方法是失敗的,而且90%的時(shí)間都在做數(shù)據(jù)清理。這就說(shuō)明,想通過(guò)大數(shù)據(jù)技術(shù)一下子解決所有的問(wèn)題是很難成功的,而是要用抽絲剝繭、循序漸進(jìn)的方式。
管理層的惰性
某家旅游公司系統(tǒng)通過(guò)web日志數(shù)據(jù)的挖掘來(lái)提升客戶洞察。結(jié)果證明,用戶在瀏覽網(wǎng)站之后,隨后的消費(fèi)行為模式與管理層所認(rèn)為的不一致。當(dāng)團(tuán)隊(duì)匯報(bào)此事時(shí),管理層認(rèn)為不值一提。但是,該團(tuán)隊(duì)并沒(méi)有放棄,并通過(guò)嚴(yán)密的A/B測(cè)試,回?fù)袅斯芾韺拥妮p視。
這個(gè)案例的最終結(jié)果,不是每個(gè)CIO都能期盼的。但是,有一點(diǎn)是可以確定的:做好和管理層打交道的準(zhǔn)備,讓他們充分理解大數(shù)據(jù)是什么以及相應(yīng)的價(jià)值。
應(yīng)用場(chǎng)景選擇錯(cuò)誤
一家保險(xiǎn)公司想了解日常習(xí)慣和購(gòu)買生命保險(xiǎn)意愿之間的關(guān)聯(lián)性。由于隨后覺(jué)得習(xí)慣太過(guò)于寬泛,該公司將調(diào)查范疇限定到是否吸煙上。但是,工作仍然沒(méi)有實(shí)質(zhì)進(jìn)展。不到半年,他們就終止了整個(gè)項(xiàng)目,因?yàn)橐恢蔽茨馨l(fā)現(xiàn)任何有價(jià)值的信息。
這個(gè)項(xiàng)目的失敗是由于問(wèn)題的復(fù)雜性。在抽煙與否之間,該公司沒(méi)有注意到還有大片灰色地帶:很多人是先抽煙而后又戒煙了。在將問(wèn)題簡(jiǎn)單化動(dòng)機(jī)的驅(qū)動(dòng)下,這個(gè)部分被忽略了。
問(wèn)題梳理不夠全面
一家全球性公司的大數(shù)據(jù)團(tuán)隊(duì)發(fā)現(xiàn)了很多深刻的洞察,并且計(jì)劃通過(guò)云讓全公司共享。結(jié)果這個(gè)團(tuán)隊(duì)低估了效率方面的損耗,由于網(wǎng)絡(luò)擁塞的問(wèn)題,無(wú)法滿足全球各個(gè)分支順暢提交數(shù)據(jù)運(yùn)行分析的需求。
該公司應(yīng)該仔細(xì)思考下如何支撐大數(shù)據(jù)項(xiàng)目,梳理所需的技能并協(xié)調(diào)各IT分支的力量進(jìn)行支持。由于網(wǎng)絡(luò)、安全或基礎(chǔ)設(shè)施的問(wèn)題,已經(jīng)有太多的大數(shù)據(jù)項(xiàng)目栽了跟頭。
缺乏大數(shù)據(jù)分析技能
一家零售公司的首席執(zhí)行官不認(rèn)同亞馬遜規(guī)?;?、扁平化的服務(wù)模式,因此讓CIO構(gòu)建一個(gè)客戶推薦引擎。項(xiàng)目最初的規(guī)劃是半年為期,但是團(tuán)隊(duì)很快認(rèn)識(shí)到諸如協(xié)同過(guò)濾(collaborative filtering)之類的概念無(wú)法實(shí)現(xiàn)。為此,一個(gè)團(tuán)隊(duì)成員提出做一個(gè)“假的推薦引擎”,把床單作為唯一的推薦產(chǎn)品。這個(gè)假引擎的工作邏輯是:買攪拌機(jī)的人會(huì)買床單,買野營(yíng)書籍的人會(huì)買床單,買書的人會(huì)買床單。就是如此,床單是唯一的、默認(rèn)的推薦品。
盡管可笑,這個(gè)主意其實(shí)并不壞,默認(rèn)的推薦也能給企業(yè)帶來(lái)銷售上的提升。但是,由于大數(shù)據(jù)相關(guān)技能的缺失,真正意義上的引擎未能實(shí)現(xiàn)。
提出了錯(cuò)誤的問(wèn)題
一家全球領(lǐng)先的汽車制造商決定開展一個(gè)情感分析項(xiàng)目,為期6個(gè)月,耗資1千萬(wàn)美元。項(xiàng)目結(jié)束之后,該廠商將結(jié)果分享給經(jīng)銷商并試圖改變銷售模式。然后,所得出的結(jié)果最終被證
明是錯(cuò)誤的。項(xiàng)目團(tuán)隊(duì)沒(méi)有花足夠的時(shí)間去了解經(jīng)銷商所面臨的問(wèn)題或業(yè)務(wù)建議,從而導(dǎo)致相關(guān)的分析毫無(wú)價(jià)值。
應(yīng)用了錯(cuò)誤的模型。某銀行為判斷電信行業(yè)的客戶流失情況,從電信業(yè)聘請(qǐng)了一位專家,后者也很快構(gòu)建了評(píng)估用戶是否即將流失的模型。當(dāng)時(shí)已進(jìn)入評(píng)測(cè)驗(yàn)證的最后階段,模型很快就將上線,而銀行也開始準(zhǔn)備給那些被認(rèn)為即將流失的客戶發(fā)出信件加以挽留。