再舉個例子,美國與西班牙戰(zhàn)爭爆發(fā)后,不少美國人不愿意參軍,坦誠因為怕死,針對這種情況,美國軍方做了一份統(tǒng)計報告來奉勸大家參軍:“據(jù)可靠數(shù)據(jù)統(tǒng)計,美國海軍的死亡率是0.9%,而同時期紐約市民的死亡率是1.6%”,潛臺詞是如果懼怕死亡更應(yīng)該參軍,因為軍營比紐約的家中還安全,你能找到這個悖論的原因嗎?
再看看“外地人都挺有本事的,看看來這里的個個都很有能耐”,“別人家的孩子都考上了重點中學”,“省級醫(yī)院的這個科室的病人死亡率甚至比小縣城的還高”這些言語,你真得覺得不合理嗎?
統(tǒng)計學是一門嚴謹?shù)倪壿媽W問,鍛煉自己的思考能力總能幫你更容易認識本質(zhì)。
Part 11:個體的悲哀
有一個數(shù)學教授平生最怕坐飛機,他研究了近20年的統(tǒng)計數(shù)據(jù),發(fā)現(xiàn)恐怖分子帶炸彈上飛機的幾率其實非常低,但是他還不安心,他又進一步研究數(shù)據(jù)發(fā)現(xiàn),兩個人同時帶炸彈上飛機的幾率幾乎為零,于是從此他坐飛機都自己攜帶一枚炸彈。
有時候我們會拿著一些統(tǒng)計數(shù)據(jù)來預(yù)測一些事情,比如你很想知道自己的孩子將來會長多高,你找到統(tǒng)計局得到孩子每個年齡段的平均身高數(shù)據(jù),你為自己的孩子當前未達標的身高苦惱不已,但你要知道,統(tǒng)計數(shù)據(jù)針對的是群體,對于個體它失去了效用,如果要預(yù)測個體,看看你自己長多高比統(tǒng)計數(shù)據(jù)靠譜的多。
有時候,我們混淆了統(tǒng)計和個體的差別,被平均是太正常的事情,因此,大多數(shù)時候,股市漲,專家看漲,你還總是虧錢,這是太正常的事情,你自己卻無法理解。
11種數(shù)據(jù)說謊的藝術(shù),總是時不時的出現(xiàn)在我們的周圍,無論你多么小心,總會時不時的被欺負一下,用以下頗有諷刺意味的科學家故事結(jié)束。
“阿基米德的浴缸、牛頓的蘋果、瓦特的茶壺、愛因斯坦的小板凳......科學史上流傳著太多我們耳熟能詳?shù)墓适?,它們帶著強烈的傳奇色彩,在孩提時代曾那樣打動我們的心靈,喚起對于天才的崇敬和對于科學的無限向往,然而時至今日,我們再度回頭審視這些傳說,卻發(fā)現(xiàn)許多時候,它們的象征意義過于濃厚,從而不可避免掩蓋了歷史的本來面目,令人吃驚的是,大家從小所熟悉的那些科學家故事,若是仔細推敲起來,幾乎沒有多少是站得住腳的,傳奇最終變成了神話,而我們也終究長大”。
大數(shù)據(jù),一門揭露真相的藝術(shù),不要重蹈覆轍吧。
作者簡介:傅一平,博士,畢業(yè)于浙江大學,從事電信行業(yè)工作,專注于大數(shù)據(jù)采集、處理、建模、管理、變現(xiàn)及產(chǎn)業(yè)等研究。