2012年7月,雷·庫茲韋爾與Google總裁拉里·佩奇會面,那時他不是來求職的。庫茲韋爾,鼎鼎大名的機械智能學家,他告訴佩奇自己對打造全智能計算機頗有研究,已經(jīng)有了初步的計劃,準備開始設立公司打造這樣的計算機。他所述的全智能計算機指的是能夠自己理解語言,自己進行推論,自己做決定的計算機。
要完成這項工作,自然要用到Google的數(shù)據(jù)和計算能力。“我可給幫你弄到數(shù)據(jù)和服務器,但是要靠一家公司完成,太難了,”佩奇對他說,于是建議從來沒有為別人打過工的庫茲韋爾加入Google公司。經(jīng)過6個月的掙扎,庫茲韋爾最后還是選擇了以工程總監(jiān)的身份加入Google。他說:“這是我50多年來研究人工智能的頂峰。”
吸引庫茲韋爾加入Google的不僅僅是Google獨有的數(shù)據(jù)和強大的超級計算機,而是Google公司內(nèi)部一個正在閃閃發(fā)光的人工智能分支部門“深度學習”。Google公司的深度學習軟件嘗試模仿人的大腦皮層中的神經(jīng)層活動(該區(qū)域負責人腦80%的思維)。這個軟件可以識別數(shù)字化的聲音、圖片和其他數(shù)據(jù)片段。
神經(jīng)網(wǎng)絡這一基本思想已經(jīng)出現(xiàn)了幾十年,但是卻沒有取得多少突破。不過,借助算法的改進和計算機性能的猛增,科學家現(xiàn)在可以模擬更多的神經(jīng)層神經(jīng)活動。
借助深度學習,他們在語音識別、圖像識別領(lǐng)域取得了突飛猛進的進步。2012年6月,Google公司的深度學習系統(tǒng)在識別物體的精確度上比上一代系統(tǒng)提高了一倍,并且大幅度削減了Android系統(tǒng)語音識別系統(tǒng)的錯誤率。2012年12月,微軟亞洲研究院展示了中英即時口譯系統(tǒng),錯誤率僅為7%,而且發(fā)音十分順暢。同樣在12月,一群大學生和兩名教授組成的團隊利用深度學習軟件完成分子識別,可用于發(fā)現(xiàn)治病新藥。
Google目前正成為一塊寫著“深度學習”的吸鐵石,吸引著來自全世界的高端、專業(yè)人士。2013年3月,Google公司收購了一家深度學習企業(yè)。這家企業(yè)由多倫多大學計算機科學教授杰弗里·希頓(Geoffrey Hinton)創(chuàng)立,曾獲默克大獎。希頓目前已經(jīng)把自己的時間一分為二,一半給了大學,一半給了Google。他的計劃是“將大學中的理論拿出來,應用在現(xiàn)實問題上”,比如說 圖像識別、搜索、自然語言理解等有關(guān)人工智能。
上面提到的應用領(lǐng)域時刻在提醒著人工智能研究者:科幻電影里智能機器很有希望出現(xiàn)在現(xiàn)實生活中。確實,機器智能的應用領(lǐng)域正從交流、計算轉(zhuǎn)向醫(yī)療、制造業(yè)和運輸。比如,IBM公司的深度學習技術(shù)正用于訓練醫(yī)師,幫助他們做出正確的選擇;微軟的深度學習技術(shù)則應用于Windows Phone和Bing語音搜索中。
然而,要將深度學習應用領(lǐng)域從圖像和語音識別擴大到其他領(lǐng)域需要在概念和軟件上做更大的突破,而且還需要計算機的計算能力進一步提高。也許幾年之內(nèi),我們還見不到全智能計算機,但是幾十年內(nèi)出現(xiàn)這樣的計算機是沒有問題的。微軟美國研究院的院長Peter Lee說:“深度學習激起了人工智能領(lǐng)域新的挑戰(zhàn)。”