科學界也有像Elon Musk那樣玩嘛嘛酷的偶像派人物?當然有,除了美國總統(tǒng)奧巴馬想跟他“玩”以外,恐怕未來每屆的總統(tǒng)候選人也都想跟他“玩”,他就是美國當前政治圈里的超級新星Nate Silver,號稱為美國公眾眼里完美的“預言帝”,他的“預言”被稱為競選預測之神諭。
這哥們曾單槍匹馬打敗了所有時政記者、政黨媒體顧問以及政治評論員,讓研究數(shù)字的書呆子們好好風光了一把,美國人也因此說奧巴馬的勝利也是統(tǒng)計學家的勝利。讓我們把時間追溯回2012年美國總統(tǒng)大選時,當時奧巴馬和羅姆尼選情普遍認為很接近,評論員們都無法預計哪方會獲勝,Silver卻計算出“真實”情況指出二者并非處于旗鼓相當?shù)木置?,在投票當天他成功預測奧巴馬將有90.9%機會獲得大多數(shù)選票,最后他對美國50個州投票結(jié)果的預測全對了。事實上,2008年的總統(tǒng)大選他也預測對了最終結(jié)果,美國50個州的投票結(jié)果他預測對了49個。
Silver的選情分析被極度精妙的美國政治評論圈認為是達到了前所未有的水平,但因為他所使用的是被學界稱為“巫術(shù)統(tǒng)計”的貝葉斯理論,所以也招惹來頻率學派和一些保守的統(tǒng)計科學家們質(zhì)疑,還有一些來自政黨和媒體們的指責,因為Silver的預測就像是軍事級別而且是精確到個人的傾向式報導,接下來的每一次大選,整個政治圈和媒體圈只能“坐以待斃”。
“大數(shù)據(jù)是非常重要的工具,而不是一個游戲”
在美國,做選情預測的統(tǒng)計員不計其數(shù),之所以Silver能夠一戰(zhàn)成名成為美國數(shù)據(jù)超人,皆因他在大選的節(jié)骨眼上一個人證明了大多數(shù)時政評論員是“無用”,同時他在紐約時報網(wǎng)站的博客讓眾多企業(yè)看到了大數(shù)據(jù)應(yīng)用的真實性和大數(shù)據(jù)可視化、行業(yè)化的希望。
Silve在2008年大選結(jié)束之后,很快就出版了他的處女作《信號與雜音:預測學的藝術(shù)與科學》,牛津大學數(shù)據(jù)專家維克多·邁耶曾對這本書稱贊道,大數(shù)據(jù)革命將改變我們的生活、工作和思維模式,我們不必擔心數(shù)據(jù)對我們自身有多大的相關(guān)性,大數(shù)據(jù)會讓我們看清楚“假說”意義,未來它將會成為影響我們決策的重要因素,因為它重塑了我們眼前的世界。
事實上,Silver也開始擔心:他的聲望將會影響往后的選情,也將失去旁觀者清優(yōu)勢。他并不希望人們視他為科學界“占卜的巫師”,不希望人們因此迷信這些預測,“預測是一門嚴謹科學,不是一種游戲,我們要用來衡量我們主觀現(xiàn)實是否能與客觀世界吻合。”
從大數(shù)據(jù)實用性來看,大數(shù)據(jù)可以幫我們解決如災(zāi)害預告、財務(wù)預告等實際問題,但Silver也指出,數(shù)據(jù)是有陷阱的,人們經(jīng)常對數(shù)據(jù)產(chǎn)生虛有的危險幻想。“概率性思考還是絕對性思考在預測中有著截然相反的導向,如果不能做到誠實地看待數(shù)據(jù),預測有可能變成災(zāi)難,忽略事物的不確定性往往會導致嚴重后果。”
Silver舉例分析,1997年時美國國家氣象局預測,大??怂沟暮樗皇?9英尺,鎮(zhèn)上的防洪堤限定為承受51英尺的洪水,并未將通過歷史數(shù)據(jù)的正負9英尺誤差算進去,結(jié)果洪水達到了54英尺,大??怂乖庥隽颂卮蠛樗疄?zāi)難。日本福島核反應(yīng)堆是另外一個活生生的樣本,過去45年間福島最大的地震記錄是里氏規(guī)模8.0級,日本地震研究人員參考這個數(shù)據(jù)后,他們預測該地區(qū)不會超過里氏9.0級的地震規(guī)模,然后按8.5級的防震標準來建造核反應(yīng)堆,而事實上福島在過去更早的時間曾發(fā)生過9級地震,但這種情況被認為排除了,這個預測最終為日本乃至全球帶了歷史性的災(zāi)難。
“數(shù)據(jù)本身是不能為自己代言的,我們經(jīng)常是帶著偏差的思想、個人興趣的情況開展數(shù)據(jù)分析,我們必須知道在你所接收到信息和你知道的信息之間是存在巨大鴻溝的。”Silve同時指出,是否看到自己弱點也對分析數(shù)據(jù)有較大的影響,因為明白自己弱點人反而會采取一定辦法來抵消它的作用。
相比而言,他認為從民眾調(diào)查得回來的建模數(shù)據(jù)更可靠,因為沒有經(jīng)過媒體的渲染,直接到達他手中民意信息更真實,民眾是不可能持續(xù)性地高度關(guān)注政治動態(tài)的。