目前人工智能在學習上遵循的理論依然是上個世紀80年代提出的,人們并沒有從本質(zhì)上理解人類的學習原理,從監(jiān)督學習到無監(jiān)督學習的方法還在探索。如果將人工智能比作建造太空火箭,計算能力和數(shù)據(jù)是燃料,理論就是發(fā)動機。如果你有許多燃料但只擁有小功率發(fā)動機,你的火箭大概無法飛離地面。如果你擁有大功率發(fā)動機但只有一點點燃料,你的火箭即使飛上天也無法進入軌道。
目前的人工智能技術(shù)多數(shù)都要依靠形態(tài)匹配,在監(jiān)督式學習下,輸入訓練數(shù)據(jù),每組訓練數(shù)據(jù)有一個明確的標識或結(jié)果。人們將預(yù)測結(jié)果與「訓練數(shù)據(jù)」的實際結(jié)果進行比較,不斷調(diào)整預(yù)測模型,直到模型的預(yù)測結(jié)果達到一個預(yù)期的準確率。
而無監(jiān)督學習中,計算機無需人類幫助的情況下,像人類一樣自己學習知識。計算機并不被告知怎么做,而是采用一定的激勵制度來訓練機器人培養(yǎng)出正確的分類。無監(jiān)督學習方式是機器人工智能發(fā)展的關(guān)鍵技能之一。“目前朝著良性的趨勢發(fā)展,但還未達到我們希望的階段。”微軟亞洲研究院院長芮勇表示。
第二大考驗:知識表達問題。
許多輸入的數(shù)據(jù)其實都經(jīng)過了人腦抽象,但大家看不到,就好比你看到地面上的竹子每一根都是獨立的,但它的地下莖聯(lián)系是非常緊密的。若要完成形式化知識結(jié)構(gòu)的搭建,是需要很多知識的,而機器中沒有人腦中的背景知識,所以數(shù)據(jù)中蘊含的信息是不完整的,繼而計算不出正確的結(jié)果。
如果將這些信息補足,是有可能用機器處理的。但同時要看到的是這些信息很難補足,一方面是因為很多人腦中的知識難以形式化,另一方面,補什么補多少才能達到特定的效果,很難衡量。并且人腦輸出的信息帶寬太小,很難通過一個人來補足機器中沒有的知識,而多人協(xié)同又存在知識相互不兼容的問題。所以知識太多,知識難以形式化,人腦輸出太慢,成為了知識表達的三大障礙。
海云數(shù)據(jù)的首席數(shù)據(jù)科學家趙丹表示,目前大公司基本上通過知識圖譜來解決知識表達的問題,但這不是根本的解決方法。知識圖譜雖然能在小的特定領(lǐng)域解決一部分數(shù)據(jù)稀疏問題,但圖譜本身也有稀疏的問題,并且依賴人工構(gòu)建,規(guī)模有限。遷移學習也能夠發(fā)揮一定作用,但目前還沒有把這些解決技術(shù)整合起來,形成一個完整的智能體系的理論架構(gòu)。
同時趙丹還認為,深度學習的研究一定程度上已經(jīng)到達瓶頸期,現(xiàn)在到了需要將深度學習現(xiàn)有的成果轉(zhuǎn)化成產(chǎn)品的時候,比如Deepmind前段時間發(fā)布的唇語識別成果,再往前比如AlphaGo的博弈策略學習。“而形成產(chǎn)品是件很難的事情,像我們熟知的人臉識別,雖然已有不少創(chuàng)業(yè)公司做了好幾年,但現(xiàn)在仍然沒有生產(chǎn)出成熟的產(chǎn)品。工程上的坑不比研究上的少,如若跨不過去就沒有辦法做出產(chǎn)品。”
在科學理論上的進步很多是偶然事件,說不準下次會是什么時候。深度學習的成果轉(zhuǎn)換期,到下次深度學習的進步期之間其實還是會有可能出現(xiàn)寒潮。
第三大考驗:人才問題。
圖像識別方面的成就像一把發(fā)令槍,啟動了一場人才爭奪賽。有人曾說:“這個領(lǐng)域的人才戰(zhàn)相當血腥,一流的人才就像NFL足球運動員。”
谷歌在2011年推出專注深度學習的谷歌大腦計劃(Google Brain Project),2013年3月得到了神經(jīng)網(wǎng)絡(luò)先驅(qū)Geoffrey Hinton的加入,現(xiàn)在有超過1000個深度學習項目。
Yann LeCun,現(xiàn)任Facebook人工智能研究部門主管。
Facebook在2013年12月聘請了法國神經(jīng)網(wǎng)絡(luò)創(chuàng)新者Yann LeCun作為它的新AI實驗室的帶頭人。平均每天使用神經(jīng)網(wǎng)絡(luò)翻譯來自超過40種語言國家的20億用戶的帖子,這些翻譯的內(nèi)容每天被8000萬用戶閱讀。
百度在2014年4月聘請了谷歌腦計劃的前負責人吳恩達作為它的人工智能實驗室的領(lǐng)頭人,主攻語音識別等關(guān)鍵領(lǐng)域。
但蔣濤指出:現(xiàn)在人工智能領(lǐng)域的理論掌握在頂尖教授手上,但應(yīng)用的數(shù)據(jù)在公司手上。頂尖教授一般會有與同行進行交流、發(fā)表研究成果的訴求,但公司的研發(fā)卻要求不能透露商業(yè)核心秘密,甚至要將這個科學家雪藏起來,比如蘋果現(xiàn)在人工智能的領(lǐng)導者是誰,我們都還不知道。這里面存在天然的沖突,很可能成為制約人工智能發(fā)展的瓶頸。