魯迅評(píng)價(jià)諸葛亮“多智而近妖”,此話見諸《中國小說史略》,意思說諸葛亮足智多謀,像個(gè)妖怪。
而如今,從大數(shù)據(jù)的角度看,諸葛亮的足智多謀是因?yàn)樗莆樟藬?shù)據(jù)建模的辦法。
今天,我們就來說說這諸葛先生的“數(shù)據(jù)建模”之道。
建模里的“模”是指模型。使材料成為一定形狀的工具,就屬于“模型”,這些模型看得見摸得著,叫做“具象模型”。但是也有些模型看不見摸不著,屬于“抽象模型”,數(shù)據(jù)模型就是這其中一類。
“數(shù)據(jù)建模”是對(duì)雜亂無序的數(shù)據(jù)進(jìn)行處理,篩選出有價(jià)值的數(shù)據(jù)結(jié)果的過程,其關(guān)鍵步驟有兩個(gè):一是邏輯建模;二是物理建模。
我們以諸葛亮的“草船借箭”為例,講講如何“數(shù)據(jù)建模”。
數(shù)據(jù)建模的方向、用途
《三國演義》第四十六回講到,周瑜問孔明:“即日將與曹軍交戰(zhàn),水路交兵,當(dāng)以何兵器為先?”
孔明曰:“大江之上,以弓箭為先。”
瑜曰:“但今軍中正缺箭用,敢煩先生監(jiān)造十萬支箭,以為應(yīng)敵之具。此系公事,先生幸勿推卻。”
孔明曰:“都督見委,自當(dāng)效勞。”
為什么要借箭?因?yàn)橹T葛亮答應(yīng)周瑜造十萬支箭來攻打曹操。這說的是數(shù)據(jù)建模的方向和用途。
數(shù)據(jù)源收集
孔明曰:“為將而不通天文,不識(shí)地利,不知奇門,不曉陰陽,不看陣圖,不明兵勢(shì),是庸才也。”
可見,全方位的信息收集和積累多么的重要。
而這個(gè)過程,在數(shù)據(jù)建模中叫做數(shù)據(jù)源收集。
邏輯梳理
數(shù)據(jù)收集上來之后,諸葛亮通過梳理得出如下結(jié)論:
1,“今日有大霧”,這是說天氣;
2,“吾料曹操于重霧中必不敢出”,這是說曹操的心理特點(diǎn);
3,“子敬只得就我”,這是說魯肅的權(quán)利;
這都需要對(duì)數(shù)據(jù)源有充分的認(rèn)知和理解,在數(shù)據(jù)建模中,這個(gè)過程叫做邏輯梳理
這一過程雖然十分抽象,但它能幫助我們確定方案。
接著,諸葛亮對(duì)魯肅說:“望子敬借我二十只船,每船要軍士三十人,船上皆用青布為幔,各束草千余個(gè),分布兩邊。”這就是草船借箭的方案。
到這里,邏輯建模就完成了。
判斷標(biāo)準(zhǔn)
接下來,是把邏輯建模轉(zhuǎn)化為物理建模。針對(duì)梳理好的邏輯:
1,霧有多濃才能不暴露目標(biāo)?“是夜大霧漫天,長(zhǎng)江之中,霧氣更甚,對(duì)面不相見。”
2,曹操多疑才會(huì)按兵不動(dòng)?“重霧迷江,彼軍忽至”。
3,魯肅能調(diào)來多少船只和人?“卻說魯肅私自撥輕快船二十只,各船三十余人。”
這都是條件級(jí)別;而它們?cè)诮V懈髡级啻蟊戎?,叫做?quán)重設(shè)置。二者統(tǒng)稱為“判斷標(biāo)準(zhǔn)”。它是數(shù)據(jù)量化的過程,也是物理建模的第一步。
校驗(yàn)?zāi)P?/p>
諸葛亮乘船擂鼓吶喊,軍士慌忙飛報(bào)曹操。
曹操說:“可撥水軍弓弩手亂箭射之。”差人火速到江邊助射。
曹操果然被諸葛亮料到不敢出帳,只是射箭防御,這在數(shù)據(jù)建模中叫做“校驗(yàn)?zāi)P?rdquo;。
模型試點(diǎn)、模型確定
接下來,就是重點(diǎn)了。
“二十只船,用長(zhǎng)索相連,徑望北岸進(jìn)發(fā)。當(dāng)夜五更時(shí)候,船已近曹操水寨。孔明教把船只頭西尾東,一帶擺開,就船上擂鼓吶喊。少頃,旱寨內(nèi)弓弩手亦到,約一萬余人,盡皆向江中放箭:箭如雨發(fā)”。
先讓船只一面受箭,這是“模型試點(diǎn)”;
萬箭齊發(fā),這說明試點(diǎn)成功,由此模型確定,可以進(jìn)行輸出和實(shí)際應(yīng)用了;
“孔明教把船吊回,頭東尾西,逼近水寨受箭,一面擂鼓吶喊。待至日高霧散,孔明令收船急回。
最后,“草船借箭”成功了,“魯肅人見周瑜,備說孔明取箭之事。瑜大驚,慨然嘆曰:”孔明神機(jī)妙算,吾不如也!‘“這么看來孔明的神機(jī)妙算還真是數(shù)據(jù)建模的成果!
實(shí)際上,數(shù)據(jù)建模的類型是多種多樣的,比如:從算法上看,它包括定向邏輯算法和非定向邏輯算法;另外,非定向邏輯算法中還包含聚類和決策樹等模型。上面講的例子就屬于定向邏輯算法中的打分算法啦。
海爾SCRM數(shù)據(jù)建模
海爾有一個(gè)會(huì)員俱樂部,叫夢(mèng)享+.用戶注冊(cè)夢(mèng)享+會(huì)員后,會(huì)產(chǎn)生很多數(shù)據(jù),數(shù)據(jù)存放的平臺(tái)叫SCRM:社交化客戶關(guān)系管理平臺(tái)?,F(xiàn)在,SCRM數(shù)據(jù)平臺(tái)里面已經(jīng)存放著1.2億海爾老用戶數(shù)據(jù)。