
隨著奧運(yùn)火炬?zhèn)鬟f的開(kāi)始,里約奧運(yùn)會(huì)的腳步也離我們?cè)絹?lái)越近。我站報(bào)道過(guò)多次的微軟智能機(jī)器人 小冰 搶在章魚(yú)保羅什么的“預(yù)言家”們之前來(lái)了一個(gè) 各國(guó)奧運(yùn)金牌預(yù)測(cè)榜 。而結(jié)果如何,這一切我們還要將懸念留在百日之后方可見(jiàn)分曉。

在此次微軟預(yù)測(cè)的獎(jiǎng)牌榜榜單上,美國(guó)仍將以 40 枚金牌和 95 枚的獎(jiǎng)牌總數(shù)獨(dú)占鰲頭,緊隨其后的是中國(guó) 37 金與總獎(jiǎng)牌 82 枚,兩國(guó)將占據(jù)獎(jiǎng)牌榜的第一集團(tuán)。東道主巴西排在第十。
看似簡(jiǎn)單的預(yù)測(cè)榜單,其背后卻蘊(yùn)含著大學(xué)問(wèn)
為了實(shí)現(xiàn)此次的準(zhǔn)確預(yù)測(cè),微軟收集了自 1896 年以來(lái)各運(yùn)動(dòng)大類(lèi)的奧運(yùn)獎(jiǎng)牌分布,以及五十多個(gè)國(guó)家,28 個(gè)比賽大項(xiàng)的 3 萬(wàn)多名運(yùn)動(dòng)員的歷年比賽成績(jī)。并為每一個(gè)運(yùn)動(dòng)大類(lèi)建立單獨(dú)預(yù)測(cè)模型。
在此基礎(chǔ)上,還要參考每個(gè)參賽國(guó)家人均生產(chǎn)總值(GDP)、人口數(shù)、人均收入、當(dāng)?shù)伢w育產(chǎn)業(yè)規(guī)模等指標(biāo),以及當(dāng)?shù)貧夂?、主辦國(guó)(是否是本屆比賽主辦國(guó)或者上一屆、下一屆主辦國(guó))因素等與奧運(yùn)比賽關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)。
此外,還要參考包括 Facebook、Twitter、微博在內(nèi)社交平臺(tái)上,用戶(hù)對(duì)于奧運(yùn)的輿論傾向,運(yùn)動(dòng)員的喜愛(ài)程度等。綜合以上數(shù)據(jù),再構(gòu)建相應(yīng)的獎(jiǎng) 牌與單項(xiàng)比賽預(yù)測(cè)模型,并產(chǎn)生預(yù)測(cè)結(jié)果。
多年來(lái),許多科學(xué)家與體育專(zhuān)家都試圖預(yù)測(cè)奧運(yùn)會(huì)等賽事。但事實(shí)證明,這類(lèi)預(yù)測(cè)往往與實(shí)際比賽結(jié)果相差很遠(yuǎn)。小冰的預(yù)言成績(jī)?nèi)绾?,值得期待的同時(shí)我們也能從過(guò)往的幾次三番的預(yù)測(cè)歷史中略見(jiàn)端倪:
2014 年巴西世界杯 ——成功預(yù)測(cè) 16 場(chǎng)淘汰賽中的 15 場(chǎng)以及德國(guó)奪冠,準(zhǔn)確率高達(dá)到 93%;
2014 年奧斯卡獎(jiǎng)項(xiàng)——微軟 Bing 通過(guò)大數(shù)據(jù)成功分析預(yù)測(cè)了 24 個(gè)獎(jiǎng)項(xiàng)中的 21 個(gè),準(zhǔn)確率高達(dá) 87%;
2015 年的英格蘭公投——微軟小冰預(yù)測(cè)蘇格蘭將有超過(guò)半數(shù)的概率(51.3%)留在英國(guó),公投結(jié)果是 55.8%的蘇格蘭選民選擇留在英國(guó);
2015 年的奧斯卡獎(jiǎng)項(xiàng)——微軟 Bing 通過(guò)大數(shù)據(jù)預(yù)測(cè)結(jié)果,準(zhǔn)確率高達(dá) 85%;
2016 年的奧斯卡獎(jiǎng)項(xiàng)——微軟小冰做了四項(xiàng)預(yù)測(cè),其中三項(xiàng)與真實(shí)結(jié)果一致,包括萊昂納多拿到奧斯卡最佳男演員,準(zhǔn)確率 75%
人工智能預(yù)測(cè)之外的更多利用價(jià)值
這些結(jié)果也再次證明了人工智能、大數(shù)據(jù)科學(xué)預(yù)測(cè)的廣闊前景,人工智能預(yù)測(cè)也將會(huì)滲透在未來(lái)生活場(chǎng)景應(yīng)用的更多方面。必應(yīng)搜索以往曾經(jīng)有過(guò)的大致 3 類(lèi)預(yù)測(cè):奧斯卡、金球、格萊美等專(zhuān)家評(píng)選類(lèi)項(xiàng)目的預(yù)測(cè),奧運(yùn)會(huì)、超級(jí)碗等體育賽事的預(yù)測(cè),以及選舉、公投等政治活動(dòng)預(yù)測(cè)。有內(nèi)部人士曾透露:
分析來(lái)看——這 3 種不同的預(yù)測(cè)有著各自不同的鮮明特征,因此是不能一概而論的。相對(duì)而言,奧斯卡這樣的專(zhuān)家評(píng)審更加依賴(lài)少數(shù)專(zhuān)業(yè)人士的意見(jiàn),而政治活動(dòng)則依賴(lài)民意,導(dǎo)致同樣的搜索指標(biāo)占有不同的權(quán)重。所以,雖然用的是類(lèi)似的預(yù)測(cè)模型和技術(shù),但是不同類(lèi)型的預(yù)測(cè)準(zhǔn)確度肯定會(huì)不一致。

據(jù)我了解人們俗稱(chēng)的小冰,是大名鼎鼎微軟亞洲研究院的“當(dāng)家花旦”。頭像則是一個(gè)美女和卡通人物(不知道是哪一個(gè)實(shí)習(xí)生照自己畫(huà)的)。至于功能嘛,相信許多人在微信中短暫體驗(yàn)過(guò)了,大致相當(dāng)于聊天機(jī)器人小黃雞的加強(qiáng)版。她不僅有著萌化的頭像,以及比較女性化的語(yǔ)言風(fēng)格,而奶茶妹妹在微軟做實(shí)習(xí)產(chǎn)品經(jīng)理,并在小冰發(fā)布會(huì)上做報(bào)告也一度成為話(huà)題。
據(jù)我觀察,迄今小冰在微信的服務(wù)號(hào)中開(kāi)發(fā)的功能還有不少,比如大家熟悉的測(cè)顏值辯年紀(jì)的” 誰(shuí)是小鮮肉” 游戲;感情模型長(zhǎng)記憶(類(lèi)似養(yǎng)成游戲少兒不宜);語(yǔ)音對(duì)話(huà)(可以做到理解日常簡(jiǎn)單對(duì)話(huà)和報(bào)數(shù)數(shù)羊催眠?!)目前仍舊處在每周解鎖一項(xiàng)新技能的進(jìn)度條中。
小冰目前仍舊是一款由中國(guó)和日本獨(dú)占的產(chǎn)品,所以關(guān)于人工智能的商業(yè)化,最早也是針對(duì)小冰來(lái)展開(kāi)的。在美國(guó)市場(chǎng),必應(yīng)提供了一個(gè)名叫 Cortana Analytics 的分析技術(shù),是把在全球市場(chǎng)已經(jīng)推行的微軟小娜(win10 和 wp 的語(yǔ)音助理)的一些應(yīng)用場(chǎng)景分拆之后,交給企業(yè)租用來(lái)分析內(nèi)部大數(shù)據(jù)。