
來自【子柳】淘寶的人/碼農(nóng)/重度網(wǎng)癮患者的回答:
淘寶數(shù)據(jù)平臺顯示,購買最多的文胸尺碼為B罩杯。B罩杯占比達(dá)41.45%,其中又以75B的銷量最好。其次是A罩杯,購買占比達(dá)25.26%,C罩杯只有8.96%。在文胸顏色中,黑色最為暢銷。以省市排名,胸部最大的是新疆妹子。五一黃金周,淘寶旅行頻道顯示鳳凰客棧酒店預(yù)定量是去年同期的一半不到。
________________________________________________________________
來自【高濟(jì)禾】數(shù)據(jù)分析菜鳥的回答:
‘大數(shù)據(jù)’概念本身強(qiáng)調(diào)的是處理大數(shù)據(jù)的能力和技術(shù),大數(shù)據(jù)的應(yīng)用價值不在于它‘大’,而在于其細(xì)粒度信息的價值(微觀干預(yù)的能力)。這一點的確很多人、很多出版物都沒說清楚。
1 先舉幾個例子來說明什么是粗粒度信息,什么是細(xì)粒度信息:
各省市妹紙的bra size排名是粗粒度信息,每個實名妹紙的bra size是細(xì)粒度信息;
張三的九型人格類型是粗粒度信息,張三每次在某些特定情境中的行為記錄是細(xì)粒度信息;
一家媒體/一個品牌/一個品牌官微的影響力是粗粒度信息,這家機(jī)構(gòu)每次發(fā)出的信息到達(dá)了誰、這些人產(chǎn)生了什么反應(yīng)是細(xì)粒度信息;
……
2 信息的價值是什么?信息給它的擁有者帶來了什么?更直觀的感受、更精細(xì)的判斷、更準(zhǔn)確的預(yù)測…這些都是表象,信息的本質(zhì)價值體現(xiàn)在做功:擁有一段信息比沒有它能多做多少功,也就是產(chǎn)生了多少價值,也就是這段信息的價值。也因為如此,信息只有和與之匹配的做功機(jī)器放在一起才有價值。太陽光譜特征對太陽能電池廠家有價值,但對農(nóng)民就沒有價值;全國各地區(qū)妹紙的bra size對當(dāng)代的bra廠家有價值,對二百年前的織布廠就沒價值,因為農(nóng)民和織布廠的生產(chǎn)只依賴粗粒度的信息(光照強(qiáng)度、全國人均布料消費量)。
3 所有提到‘大數(shù)據(jù)是用普查代替抽樣’的類似說法,都必然說不到點子上。
為什么這么說?因為我們要搞清楚一件事:無論是抽樣還是普查,都是一種宏觀測量+操作視角,目的都是得到宏觀觀測量(研究對象的整體特征),宏觀觀測量是為了進(jìn)行宏觀干預(yù)的,宏觀干預(yù)的行動效率這就是這個信息的價值極限——不管用什么方法取得這個信息,無論這個量變得多么準(zhǔn)確。
舉例來說,如果我有一臺熱機(jī)(heat engine),那么我需要利用溫度計取得’溫度’這個宏觀量(至多4byte吧)指揮我的熱機(jī)做功?,F(xiàn)在有個做大數(shù)據(jù)的家伙出現(xiàn)了,說:你怎么還在用上個世紀(jì)的抽樣方法獲得的數(shù)據(jù)管理你的工作?!現(xiàn)在用我的xx分析儀,我可以立即給出你的熱機(jī)里每個氣體分子的熱運動數(shù)值!他說干就干,立刻安裝好全套設(shè)備,并架設(shè)好儀表板,給我一一展示:“你看這熱分布與粒徑分布的交叉分析,你看這漲落…這可是實時處理的mol級數(shù)據(jù)呢…”,最后呢,我必然要打斷他:“這些都很好,但是我還是想知道,溫度在哪顯示?”
如果我擁有的不是一臺普通熱機(jī),而是一臺3D打印機(jī),或者是一臺納米打印機(jī),或者是量子計算機(jī)之類的,那么大數(shù)據(jù)對我就非常有用,這些都不是依賴于宏觀觀測量能做的工作。
4 大數(shù)據(jù)的應(yīng)用價值很大,但現(xiàn)在的應(yīng)用普遍錯位。
在這個‘大數(shù)據(jù)‘概念剛開始被鼓吹、技術(shù)剛興起的年代,這樣的錯位在現(xiàn)實中一再發(fā)生,這一點也不荒唐。一方面,一些大數(shù)據(jù)技術(shù)公司正在千方百計地鼓動農(nóng)民和織布廠購買大數(shù)據(jù)(大數(shù)據(jù)時代的電子政務(wù)、大數(shù)據(jù)時代的品牌戰(zhàn)略)。不是說更準(zhǔn)確的數(shù)據(jù)對電子政務(wù)完全沒價值,但是投入產(chǎn)出比肯定不高,因為這些數(shù)據(jù)用抽樣一樣可以保證精度,數(shù)據(jù)再多,熱機(jī)功率也無法突破極限。
另一方面,也是更可笑的方面,是一些擁有大數(shù)據(jù)的企業(yè),正在千方百計地把他們的數(shù)據(jù)換算成’更精確的溫度‘——手握大量數(shù)據(jù),也有微觀干預(yù)的技術(shù)可行性,但是他們只想用熱機(jī)的方式利用這些數(shù)據(jù)(例如某浪總想把微博定位成媒體)。
總之,利用bra size數(shù)據(jù)提高陌生男女速配幾率是大數(shù)據(jù)的價值,把這個數(shù)據(jù)歸納為’各國bra size排行榜’給娛樂新聞供稿不是大數(shù)據(jù)的價值;根據(jù)個人交易記錄和行為特征降低在線交易的撮合成本是大數(shù)據(jù)的價值,將市場交易信息匯總成實時數(shù)據(jù)供宏觀政策決策不是大數(shù)據(jù)的價值。
更多詳細(xì)信息,請您微信關(guān)注“計算網(wǎng)”公眾號: