資誠企管顧問公司執(zhí)行董事劉鏡清
資誠企管顧問執(zhí)行董事劉鏡清,曾經(jīng)擔(dān)任IBM工商事業(yè)群總經(jīng)理,是Big Data在國內(nèi)推展的先頭部隊(duì)。他可以分享的Big Data成功應(yīng)用案例,不可勝數(shù);但他也提醒,「Idea」才是最重要的分母。
「網(wǎng)絡(luò)上關(guān)于Big Data的討論很多,似乎都認(rèn)為資料量要達(dá)到「太位元」(Terabyte,TB)才算Big Data,我的看法不太一樣!」
發(fā)會(huì)員卡是為了抽樣調(diào)查
資料究竟多大才夠?其實(shí)取決于「用途」,有時(shí)資料少少的就夠了;「采礦」(Data Mining)前,對(duì)所要探勘的答案與后續(xù)市場(chǎng)策略,要計(jì)畫得夠清楚,才是Big Data能否奏效的重點(diǎn)。
舉一個(gè)非Big Data的案例來類比,或許有助思考工具與目的的關(guān)系。日本便利商店Lawson借發(fā)行會(huì)員卡來了解消費(fèi)者「到店距離」與「購買行為」的關(guān)系。他們想知道:住在多少距離以內(nèi)的消費(fèi)者會(huì)到Lawson購物?多遠(yuǎn)的距離或哪一種商品類別,會(huì)讓消費(fèi)者選擇量販店?
所以,外界看到的或許是Lawson發(fā)行會(huì)員卡,而Lawson則心知肚明自己的目的是抽樣調(diào)查。
Big Data非新鮮事
目前全球最大的資料庫就是互聯(lián)網(wǎng),由于世代經(jīng)驗(yàn)的落差,想要了解消費(fèi)者代代不同的想法,到網(wǎng)絡(luò)上「撈」資料,是最精準(zhǔn)快速的方法,「了解使用者想什么」 ,正是臉書(Facebook)維持身價(jià)的關(guān)鍵,只是它還沒開始大張旗鼓地「開礦」。
不過,Big Data所歸屬的商用智慧(Business Intelligence,BI),已行之有年,分析大量「既有」資料的作法,并非新鮮事;只是Big Data使用累積的龐大資料,再加社群,兩項(xiàng)新元素讓既有的BI產(chǎn)生空前變化。
Big Data計(jì)算分析出的模型(pattern)具有預(yù)測(cè)能力,而且數(shù)量之多,遠(yuǎn)超出人腦所能記憶。最典型的例子是氣象預(yù)報(bào),Big Data分析的臺(tái)風(fēng)路徑,即使專業(yè)氣象人員也很難全數(shù)記住。
應(yīng)用,火星文是「罩門」
應(yīng)用Big Data,沒有產(chǎn)業(yè)限制,從半導(dǎo)體業(yè)的生產(chǎn)線品管、民生消費(fèi)與金融業(yè)創(chuàng)新產(chǎn)品與服務(wù)、手機(jī)制造商收集使用習(xí)慣,到選戰(zhàn)分析數(shù)以百計(jì)的電視談話性節(jié)目、政府部門查漏稅、漏水、疏運(yùn)交通、國土安全……,全都派得上用場(chǎng)。
「語意分析」是Big Data的最大障礙之一,它判斷有「弦外之音」的關(guān)鍵字會(huì)失準(zhǔn),也看不懂圈圈叉叉的「火星文」,否則,只要使用目標(biāo)清楚,通常都能發(fā)揮大效益。