問(wèn):所以,你只能找那些喜歡數(shù)據(jù)挖掘避過(guò)愿意使用開(kāi)源工具的人?
Leach:我曾經(jīng)看到一群物理學(xué)家在大數(shù)據(jù)領(lǐng)域工作。Hadron Collider里的工作人員每天需要沉浸在在機(jī)器產(chǎn)生的PBS數(shù)量級(jí)的數(shù)據(jù)中。經(jīng)濟(jì)學(xué)家、物理學(xué)家以及喜歡衍生工具的人,都是典型的數(shù)據(jù)分析師:他們喜歡數(shù)據(jù)。我將去經(jīng)濟(jì)學(xué)家領(lǐng)域找到合適的人才,因?yàn)槲抑安惶匾曀麄儭?/p>
問(wèn):一些公司對(duì)大數(shù)據(jù)最大的誤解是什么?
Leach:我認(rèn)為很多公司都不會(huì)意識(shí)到他們?nèi)绾卧谝婚_(kāi)始就小心翼翼的對(duì)待數(shù)據(jù)。你在數(shù)據(jù)管理、注解、組織方面花的時(shí)間少了,就會(huì)影響你如何使用數(shù)據(jù)。我們從一份統(tǒng)計(jì)里看到,當(dāng)我們的項(xiàng)目完成五個(gè)月后,就沒(méi)有人再去關(guān)注數(shù)據(jù)里。你兩年來(lái)的數(shù)據(jù)怎么處理?刪掉他?還是重新組織?鑒于目前數(shù)據(jù)存儲(chǔ)成本下降,我們可以存儲(chǔ)這些數(shù)據(jù)。
問(wèn):這或許就是你談到的,當(dāng)人們開(kāi)始面對(duì)大數(shù)據(jù)時(shí),往往會(huì)變得很短視?
Leach:不僅是IT部門(mén)的短視,連數(shù)據(jù)搜集者也是這樣。IT部門(mén)負(fù)責(zé)數(shù)據(jù)搜集,從IT的角度來(lái)看,IT部門(mén)是不會(huì)考慮長(zhǎng)遠(yuǎn)的,但搜集者也是僅僅關(guān)注當(dāng)下的數(shù)據(jù),或關(guān)注他們搜集到的數(shù)據(jù)。
問(wèn):為了實(shí)現(xiàn)大數(shù)據(jù)的目標(biāo),你需要收集足夠多的數(shù)據(jù),你手機(jī)的越多,做出的預(yù)測(cè)也越精準(zhǔn),可以這樣理解嗎?
Leach:是的,如果你真的能把握的話,大數(shù)據(jù)僅僅“大”而已。