世界杯預(yù)測(cè)模型的方法與設(shè)計(jì)其它事件的模型相同,訣竅就是在預(yù)測(cè)中去除主觀性,讓數(shù)據(jù)說話。預(yù)測(cè)性數(shù)學(xué)模型幾乎不算新事物,但它們正變得越來越準(zhǔn)確。在這個(gè)時(shí)代,數(shù)據(jù)分析能力終于開始趕上數(shù)據(jù)收集能力,分析師不僅有比以往更多的信息可用于構(gòu)建模型,也擁有在很短時(shí)間內(nèi)通過計(jì)算機(jī)將信息轉(zhuǎn)化為相關(guān)數(shù)據(jù)的技術(shù)。
幾年前,得等每場(chǎng)比賽結(jié)束以后才能獲取所有數(shù)據(jù),現(xiàn)在,數(shù)據(jù)是自動(dòng)實(shí)時(shí)發(fā)送的,這讓預(yù)測(cè)模型能獲得更好的調(diào)整且更準(zhǔn)確。微軟世界懷模型的成績(jī)說明了其模型的實(shí)力,它的成功為大數(shù)據(jù)的力量提供了強(qiáng)有力的證明,利用同樣的方法還可預(yù)測(cè)選舉或關(guān)注股票。類似的大數(shù)據(jù)分析正用于商業(yè)、政府、經(jīng)濟(jì)學(xué)和社會(huì)科學(xué),它們都關(guān)于原始數(shù)據(jù)進(jìn)行分析。
我們進(jìn)入了一個(gè)用數(shù)據(jù)進(jìn)行預(yù)測(cè)的時(shí)代,雖然我們可能無(wú)法解釋其背后的原因。如果一個(gè)醫(yī)生只要求病人遵從醫(yī)囑,卻沒法說明醫(yī)學(xué)干預(yù)的合理性的話,情況會(huì)怎么樣呢?實(shí)際上,這是依靠大數(shù)據(jù)取得病理分析的醫(yī)生們一定會(huì)做的事情。
從一個(gè)人亂穿馬路時(shí)行進(jìn)的軌跡和速度來看他能及時(shí)穿過馬路的可能性,都是大數(shù)據(jù)可以預(yù)測(cè)的范圍。當(dāng)然,如果一個(gè)人能及時(shí)穿過馬路,那么他亂穿馬路時(shí),車子就只需要稍稍減速就好。但是這些預(yù)測(cè)系統(tǒng)之所以能夠成功,關(guān)鍵在于它們是建立在海量數(shù)據(jù)的基礎(chǔ)之上的。
此外,隨著系統(tǒng)接收到的數(shù)據(jù)越來越多,通過記錄找到的最好的預(yù)測(cè)與模式,可以對(duì)系統(tǒng)進(jìn)行改進(jìn)。它通常被視為人工智能的一部分,或者更確切地說,被視為一種機(jī)器學(xué)習(xí)。真正的革命并不在于分析數(shù)據(jù)的機(jī)器,而在于數(shù)據(jù)本身和我們?nèi)绾芜\(yùn)用數(shù)據(jù)。一旦把統(tǒng)計(jì)學(xué)和現(xiàn)在大規(guī)模的數(shù)據(jù)融合在一起,將會(huì)顛覆很多我們?cè)瓉淼乃季S。所以現(xiàn)在能夠變成數(shù)據(jù)的東西越來越多,計(jì)算和處理數(shù)據(jù)的能力越來越強(qiáng),所以大家突然發(fā)現(xiàn)這個(gè)東西很有意思。所以,大數(shù)據(jù)能干啥?能干很多很有意思的事情。
例如,預(yù)測(cè)當(dāng)年葡萄酒的品質(zhì)
很多品酒師品的不是葡萄酒,那時(shí)候葡萄酒還沒有真正的做成,他們品的是發(fā)爛的葡萄。因此在那個(gè)時(shí)間點(diǎn)就預(yù)測(cè)當(dāng)年葡萄酒的品質(zhì)是比較冒險(xiǎn)的。而且人的心理的因素是會(huì)影響他做的這個(gè)預(yù)測(cè),比如說地位越高的品酒師,在做預(yù)測(cè)時(shí)會(huì)越保守,因?yàn)樗坏╊A(yù)測(cè)錯(cuò)了,要損失的名譽(yù)代價(jià)是很大的。所以的品酒大師一般都不敢貿(mào)然說今年的酒特別好,或者是特別差;而剛出道的品酒師往往會(huì)“語(yǔ)不驚人死不休的”。
普林斯頓大學(xué)有一個(gè)英語(yǔ)學(xué)教授,他也很喜歡喝酒,喜歡儲(chǔ)藏葡萄酒,所以他就想是否可以分析到底哪年酒的品質(zhì)好。然后他就找了很多數(shù)據(jù),比如說降雨量、平均氣溫、土壤成分等等,然后他做回歸,最后他說把參數(shù)都找出來,做了個(gè)網(wǎng)站,告訴大家今年葡萄酒的品質(zhì)好壞以及秘訣是什么。
當(dāng)他的研究公布的時(shí)候,引起了業(yè)界的軒然大波,因?yàn)樗鲱A(yù)測(cè)做的很提前,因?yàn)榻衲甑钠咸咽斋@后要經(jīng)過一段的時(shí)間發(fā)酵,酒的味道才會(huì)好,但這個(gè)教授突然預(yù)測(cè)說今年的酒是世紀(jì)最好的酒。大家說怎么敢這么說,太瘋狂了。更瘋狂的是到了第二年,他預(yù)測(cè)今年的酒比去年的酒更好,連續(xù)兩次預(yù)測(cè)說是百年最好的酒,但他真的預(yù)測(cè)對(duì)了?,F(xiàn)在品酒師在做評(píng)判之前,要先到他的網(wǎng)站上看看他的預(yù)測(cè),然后再做出自己的判斷。有很多的規(guī)律我們不知道,但是它潛伏在這些大數(shù)據(jù)里頭。
例如,大數(shù)據(jù)描繪“傷害圖譜”
廣州市傷害監(jiān)測(cè)信息系統(tǒng)通過廣州市紅十字會(huì)醫(yī)院、番禺區(qū)中心醫(yī)院、越秀區(qū)兒童醫(yī)院3個(gè)傷害監(jiān)測(cè)哨點(diǎn)醫(yī)院,持續(xù)收集市內(nèi)發(fā)生的傷害信息,分析傷害發(fā)生的原因及危險(xiǎn)因素,系統(tǒng)共收集傷害患者14681例,接近九成半都是意外事故。整體上,傷害多發(fā)生于男性,占61.76%,5歲以下兒童傷害比例高達(dá)14.36%,家長(zhǎng)和社會(huì)應(yīng)高度重視,45.19%的傷害都是發(fā)生在家中,其次才是公路和街道。
收集到監(jiān)測(cè)數(shù)據(jù)后,關(guān)鍵是通過分析處理,把數(shù)據(jù)“深加工”以利用。比如,監(jiān)測(cè)數(shù)據(jù)顯示,老人跌倒多數(shù)不是發(fā)生在雨天屋外,而是發(fā)生在家里,尤其是旱上剛起床時(shí)和浴室里,這就提示,防控老人跌倒的對(duì)策應(yīng)該著重在家居,起床要注意不要?jiǎng)幼鬟^猛,浴室要防滑,加扶手等等。
說明:用大數(shù)據(jù)預(yù)測(cè)思維方式來思考問題,解決問題。數(shù)據(jù)預(yù)測(cè)、數(shù)據(jù)記錄預(yù)測(cè)、數(shù)據(jù)統(tǒng)計(jì)預(yù)測(cè)、數(shù)據(jù)模型預(yù)測(cè),數(shù)據(jù)分析預(yù)測(cè)、數(shù)據(jù)模式預(yù)測(cè)、數(shù)據(jù)深層次信息預(yù)測(cè)等等,已轉(zhuǎn)變?yōu)榇髷?shù)據(jù)預(yù)測(cè)、大數(shù)據(jù)記錄預(yù)測(cè)、大數(shù)據(jù)統(tǒng)計(jì)預(yù)測(cè)、大數(shù)據(jù)模型預(yù)測(cè),大數(shù)據(jù)分析預(yù)測(cè)、大數(shù)據(jù)模式預(yù)測(cè)、大數(shù)據(jù)深層次信息預(yù)測(cè)。