數(shù)學(xué)模型
如果你已經(jīng)聽(tīng)過(guò)這個(gè)笑話,盡管打斷我:有三位統(tǒng)計(jì)學(xué)家去獵兔。他們發(fā)現(xiàn)了一只兔子。第一位統(tǒng)計(jì)學(xué)家率先開(kāi)槍?zhuān)x兔子的頭差了一英尺。第二位統(tǒng)計(jì)學(xué)家開(kāi)槍射擊,離兔子的尾巴差了一英尺。第三位統(tǒng)計(jì)學(xué)家大喊道:“我們逮住它了!”
就算你并不覺(jué)得這個(gè)笑話有多么好笑,但你卻很可能跟類(lèi)似于它所描述的獵兔者的管理人員一起工作過(guò)。他們的數(shù)學(xué)水平或許無(wú)可挑剔,但可悲的是,他們?cè)谡鎸?shí)世界的成果毫無(wú)價(jià)值。謊言,該死的謊言。各大組織到底必須掌握什么東西,才能提高其數(shù)量分析專(zhuān)家產(chǎn)生真實(shí)價(jià)值(而不是統(tǒng)計(jì)幻象)的幾率?不懂?dāng)?shù)學(xué)的高管們?cè)鯓硬拍艽_保他們不會(huì)受到“大數(shù)據(jù)”(Big Data)的蒙蔽?
我們或許可以在塞繆爾-阿貝斯曼的著作《事實(shí)的半衰期》(The Half-Life of Facts)和內(nèi)特-希爾的著作《信號(hào)與噪音》(The Signal and The Noise)中找到這些問(wèn)題的精彩答案。這兩部既相互獨(dú)立、又互為補(bǔ)充的著作深入探索了“數(shù)據(jù)”如何變?yōu)?ldquo;證據(jù)”,這么多看似高深莫測(cè)的數(shù)學(xué)模型為什么根本無(wú)法區(qū)分這兩種事物等問(wèn)題。這兩本書(shū)接受、并進(jìn)一步擴(kuò)展了納西姆-塔勒布備受歡迎并富于洞見(jiàn)的著作《被隨機(jī)現(xiàn)象蒙蔽》(Fooled By Randomness)和《黑天鵝》(The Black Swan),以及諾貝爾獎(jiǎng)得主丹尼爾-卡尼曼的卓越作品《思考,快與慢》(Thinking, Fast and Slow)所闡述的不確定性和數(shù)量的自我欺騙等主題。如同其先驅(qū)一樣,阿貝斯曼和希爾也寫(xiě)出了不僅妙趣橫生、而且具備可操作性的作品。
兩位作者都引用了馬克-吐溫、威爾-羅杰斯和查爾斯-凱特林等人頗具嘲諷意味的妙語(yǔ):“引領(lǐng)我們進(jìn)入困局的并不是我們不知道的事物,而是我們知道、但不那么真實(shí)的事物。”兩人都探討了用以區(qū)分“真實(shí)”知識(shí)和“不那么真實(shí)的”知識(shí)的媒介和機(jī)制。阿貝斯曼和希爾都言之鑿鑿地聲稱,目前占據(jù)上風(fēng)的是“不那么真實(shí)的”知識(shí)。處理的數(shù)據(jù)越多,受到的關(guān)注也就越多。
應(yīng)用數(shù)學(xué)家、哈佛大學(xué)數(shù)量社會(huì)科學(xué)研究所(Harvard's Institute for Quantitative Social Science)研究員阿貝斯曼解構(gòu)了“事實(shí)”的定義。對(duì)讀者頗為仁慈的一點(diǎn)是,他并沒(méi)有跌入后現(xiàn)代主義哲學(xué)的泥沼。相反,他深入探索了嚴(yán)肅的科學(xué)家如何確定他們自認(rèn)為了解、與其正在研究的事物相關(guān)的事實(shí)。這種“科學(xué)計(jì)量”方式——科學(xué)如何衡量其過(guò)程和進(jìn)步的科學(xué)——在確定科學(xué)家所稱的“事實(shí)”的生命周期和生態(tài)系統(tǒng)方面非常有幫助。通過(guò)這種方式,阿貝斯曼提出了一些有趣的問(wèn)題,比如:“事實(shí)”是如何誕生的?它們通常如何復(fù)制、變異和進(jìn)化?它們將在多久之后消逝?
病理缺陷
阿貝斯曼頗具挑釁性的核心觀點(diǎn)是,有一個(gè)由事實(shí)組成的虛擬物理現(xiàn)象。“事實(shí)”遵從既定的規(guī)律和軌跡,這取決于它們的界定和衡量方式。“我們每天讀新聞時(shí),可能都要面對(duì)一個(gè)關(guān)于我們的世界,與我們自認(rèn)為了解的狀況完全不同的事實(shí),”他寫(xiě)道。“但事實(shí)證明,這些日新月異的變化,雖然在我們看來(lái)它們發(fā)生了真實(shí)的相變,但并不意外,也不是隨機(jī)的。通過(guò)應(yīng)用概率,我們可以理解它們的總體行為方式,但我們也可以通過(guò)搜索我們對(duì)其認(rèn)識(shí)的速度更慢、有規(guī)律的變化,來(lái)預(yù)測(cè)這些變化。事實(shí)的快速變化,如同我們看到的其他任何事物一樣,有其自身的規(guī)則,是可衡量、可預(yù)測(cè)的。”
“可衡量”、“可預(yù)測(cè)”是什么意思?阿貝斯曼非常擅長(zhǎng)描述機(jī)構(gòu)、個(gè)人和概率的偏差,這種偏差可以扭曲科學(xué)和科學(xué)家評(píng)估、發(fā)布以及消滅“事實(shí)”的方式。
“這方面最明顯的例子出現(xiàn)在負(fù)面結(jié)果領(lǐng)域,”阿貝斯曼這樣寫(xiě)道。他援引了進(jìn)化生物學(xué)家約翰-梅納德-史密斯曾經(jīng)說(shuō)過(guò)的一段話:“統(tǒng)計(jì)學(xué)是一門(mén)讓你每年進(jìn)行20次試驗(yàn),然后在《自然》雜志(Nature)發(fā)布一個(gè)錯(cuò)誤結(jié)果的科學(xué)。然而,要是20位獨(dú)立的科學(xué)家分別進(jìn)行同一項(xiàng)試驗(yàn),其中的19位將以失敗告終,其職業(yè)生涯自然也就無(wú)法更進(jìn)一步。這種情形當(dāng)然令人苦惱,但這就是科學(xué)的運(yùn)行方式。大多數(shù)想法和實(shí)驗(yàn)都是不成功的。但最重要的是,失敗的結(jié)果也很少公布。”
問(wèn)題的關(guān)鍵并非統(tǒng)計(jì)科學(xué)或科學(xué)的統(tǒng)計(jì)學(xué)存在病理缺陷,而是這種已知的病理缺陷可以創(chuàng)造出動(dòng)機(jī),讓我們重新思考、修改并重新設(shè)計(jì)我們衡量和測(cè)試的事物。我們需要“事實(shí)”幫助我們更新我們對(duì)于“事實(shí)”的思考和理解。科學(xué)——以及為其提供驅(qū)動(dòng)和支持的日益數(shù)字化的技術(shù)——為難以理解自身不斷增長(zhǎng)的海量數(shù)據(jù)、無(wú)法為這些數(shù)據(jù)增添價(jià)值的企業(yè)提供了一個(gè)強(qiáng)大的模型。