最后一點(diǎn),我想談的是大數(shù)據(jù)發(fā)展對(duì)IT本身技術(shù)架構(gòu)的革命性影響。大數(shù)據(jù)的根基是IT系統(tǒng)。我們現(xiàn)代企業(yè)的IT系統(tǒng)基本上是建立在IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫(kù)、EMC存儲(chǔ))+Cisco模型基礎(chǔ)上的,這樣的模型是Scale-UP型的架構(gòu),在解決既定模型下一定數(shù)據(jù)量的業(yè)務(wù)流程是適配的,但如果是大數(shù)據(jù)時(shí)代,很快會(huì)面臨成本、技術(shù)和商業(yè)模式的問(wèn)題,大數(shù)據(jù)對(duì)IT的需求很快就會(huì)超越了現(xiàn)有廠商架構(gòu)的技術(shù)頂點(diǎn),超大數(shù)據(jù)增長(zhǎng)將帶來(lái)IT支出增長(zhǎng)之間的線性關(guān)系,使企業(yè)難以承受。因此,目前在行業(yè)中提出的去IOE趨勢(shì),利用Scale-out架構(gòu)+開(kāi)源軟件對(duì)Scale-up架構(gòu)+私有軟件的取代,本質(zhì)是大數(shù)據(jù)業(yè)務(wù)模型所帶來(lái)的,也就是說(shuō)大數(shù)據(jù)將驅(qū)動(dòng)IT產(chǎn)業(yè)新一輪的架構(gòu)性變革。去IOE潮流中的所謂國(guó)家安全因素,完全是次要的。
所以,美國(guó)人說(shuō),大數(shù)據(jù)是資源,和大油田、大煤礦一樣,可以源源不斷挖出大財(cái)富。而且和一般資源不一樣,它是可再生的,是越挖越多、越挖越值錢(qián)的,這是反自然規(guī)律的。對(duì)企業(yè)如此,對(duì)行業(yè)、對(duì)國(guó)家也是這樣,對(duì)人同樣如此。這樣的東西誰(shuí)不喜歡呢?因此,大數(shù)據(jù)這么熱門(mén),是完全有道理的。
三、新智慧生物的誕生?
下面的想象就更狂野了,真正要實(shí)現(xiàn),估計(jì)至少是我們十輩子或者一百輩子以后的事情。那時(shí)候,我們已經(jīng)是祖宗了哈。大家就當(dāng)科幻小說(shuō)來(lái)看好了。
從最近一位微軟副總裁的演講說(shuō)起。瑞克·拉希德(Rick Rashid)是微軟研究院的高級(jí)副總裁,有一天,他在中國(guó)的天津邁上講臺(tái),面對(duì)2000名研究者和學(xué)生,要發(fā)表演講,他非常非常緊張。這么緊張是有原因的。問(wèn)題在于,他不會(huì)講中文,而他的翻譯水平以前非常糟糕,似乎注定了這次的尷尬。
“我們希望,幾年之內(nèi),我們能夠打破人們之間的語(yǔ)言障礙,”這位微軟研究院的高級(jí)副總裁對(duì)聽(tīng)眾們說(shuō)。令人緊張的兩秒鐘停頓之后,翻譯的聲音從擴(kuò)音器里傳了出來(lái)。拉希德繼續(xù)說(shuō):“我個(gè)人相信,這會(huì)讓世界變得更加美好。”停頓,然后又是中文翻譯。
他笑了。聽(tīng)眾對(duì)他的每一句話都報(bào)以掌聲。有些人甚至流下了眼淚。這種看上去似乎過(guò)于熱情的反應(yīng)是可以理解的:拉希德的翻譯太不容易了。每句話都被理解,并被翻譯得天衣無(wú)縫。令人印象最深的一點(diǎn)在于,這位翻譯并非人類。
這就是自然語(yǔ)言的機(jī)器翻譯,也是長(zhǎng)期以來(lái)人工智能研究的一個(gè)重要體現(xiàn)。人工智能從過(guò)去到未來(lái)都有清晰而巨大的商業(yè)前景,是以前IT業(yè)的熱點(diǎn),其熱度一點(diǎn)不亞于現(xiàn)在的“互聯(lián)網(wǎng)”和“大數(shù)據(jù)”。但是,人類過(guò)去在推進(jìn)人工智能的研究遇到了巨大的障礙,最后幾乎絕望。
當(dāng)時(shí)人工智能就是模擬人的智能思考方式來(lái)構(gòu)筑機(jī)器智能。以機(jī)器翻譯來(lái)說(shuō),語(yǔ)言學(xué)家和語(yǔ)言專家必須不辭勞苦地編撰大型詞典和與語(yǔ)法、句法、語(yǔ)義學(xué)有關(guān)的規(guī)則,數(shù)十萬(wàn)詞匯構(gòu)成詞庫(kù),語(yǔ)法規(guī)則高達(dá)數(shù)萬(wàn)條,考慮各種情景、各種語(yǔ)境,模擬人類翻譯,計(jì)算機(jī)專家再構(gòu)建復(fù)雜的程序。最后發(fā)現(xiàn)人類語(yǔ)言實(shí)在是太復(fù)雜了,窮舉式的做法根本達(dá)不到最基本的翻譯質(zhì)量。這條道路最后的結(jié)果是,1960年代后人工智能的技術(shù)研發(fā)停滯不前數(shù)年后,科學(xué)家痛苦地發(fā)現(xiàn)以“模擬人腦”、“重建人腦”的方式來(lái)定義人工智能走入一條死胡同,這導(dǎo)致后來(lái)幾乎所有的人工智能項(xiàng)目都進(jìn)入了冷宮。
這里講個(gè)小插曲。我讀大學(xué)的時(shí)候,有個(gè)老師是國(guó)內(nèi)人工智能的頂級(jí)教授,還是國(guó)內(nèi)某個(gè)人工智能研究會(huì)的副會(huì)長(zhǎng)。他評(píng)述當(dāng)時(shí)的人工智能,不是人工智能,而是人工愚蠢,把人類簡(jiǎn)單的行為分解、分解再分解,再去笨拙地模擬,不是人怎么聰明怎么學(xué),而是模擬學(xué)習(xí)最蠢的人的最簡(jiǎn)單的動(dòng)作。他說(shuō),對(duì)于當(dāng)時(shí)人工智能的進(jìn)步,有些人沾沾自喜,說(shuō)好像登月計(jì)劃中人類離月亮更進(jìn)一步了,其實(shí),就是站上了一塊石頭對(duì)著月亮抒情,啊,我離你更近了。他對(duì)自己事業(yè)的自我嘲諷,讓我至今記憶非常深刻。
后來(lái)有人就想,機(jī)器為什么要向人學(xué)習(xí)邏輯呢,又難學(xué)又學(xué)不好,機(jī)器本身最強(qiáng)大的是計(jì)算能力和數(shù)據(jù)處理能力,為什么不揚(yáng)長(zhǎng)避短、另走一條道路呢?這條道路就是IBM“深藍(lán)”走過(guò)的道路。1997年5月11日,國(guó)際象棋大師卡斯帕羅夫在和IBM公司開(kāi)發(fā)的計(jì)算機(jī)“深藍(lán)”進(jìn)行對(duì)弈時(shí)宣布失敗,計(jì)算機(jī)“深藍(lán)”因此贏得了這場(chǎng)意義深遠(yuǎn)的“人機(jī)對(duì)抗”。 “深藍(lán)”不是靠邏輯、不靠所謂的人工智能取勝的,就是靠超強(qiáng)的計(jì)算能力取勝:思考不過(guò)你,但是算死你。