中國IDC圈4月18日報道,在Deepmind和AlphaGo獲得的巨大成功吸引了全世界的目光的同時,新一代人工智能德大戰(zhàn)已經開始。
Deepmind之前開發(fā)的玩雅達利(Atari)街機游戲的人工智能是全新一代的智能技術——大數據驅動通用人工智能(Big Data-driven Artificial General Intelligence)。
就像這個名字所提到的,這里有兩個重要的因素,一是“大數據”驅動,二是通用人工智能。大數據驅動的機器學習使得機器盡量脫離人類的經驗指導,自動在海量數據和工作環(huán)境中挖掘知識取得進步。而通用人工智能基于端對端(end-to-end)的深度強化學習(Deep Reinforcement Learning),幫助機器能在不同的任務中共享一套學習框架,無需人類進一步調試。
這兩個因素同時作用出一個效果,即人需要的干預越來越少,而機器在與環(huán)境交互反饋中的自主學習比重越來越大。
“大數據”驅動的機器學習
AlphaGo的圍棋棋力來自于30萬張人類對弈棋譜以及3千萬次自我對弈,這是一個典型的大數據機器學習產物。
相比之下,1996年擊敗國際象棋大師卡斯帕羅夫的IBM深藍(Deep Blue)人工智能,其依賴的是大量人類總結出來的走子規(guī)則的手動輸入,以及基于超級計算機每秒上億次搜索的全寬度(full-width)搜索解決方案。
簡單地說,深藍的人工智能相當于人類把自己下象棋的知識和經驗手動輸入電腦中,而AlphaGo的人工智能是人類把一堆棋譜“丟”給電腦,后者自己學習總結出來甚至進一步超出人類圍棋認知范疇的知識。
基于機器學習來搭建人工智能,人類不需要通過顯示地編程來教機器如何工作,而是給出一個學習框架,告訴機器如何根據自身當前設置以及提取環(huán)境的反饋去進一步更新參數,進而達到一個更好的工作表現(xiàn)。
然后人類只需要把大量數據“喂”進機器,機器就可以不斷學習不斷優(yōu)化自身的參數了。這樣,人類就不需要自己首先去總結經驗再交給機器,而是變成了“甩手掌柜”,在一邊看著機器學習起來就行。
隨著機器學習的模型先進性以及機器處理大數據的能力不斷升級,基于大數據的人工智能已經在人們的生活當中扮演越來越重要的角色。
過去10年間,基于大數據的人工智能已經在各個領域展露頭角,包括在線廣告的精準投放、搜索引擎?zhèn)€性化網頁排序、電商的個性化商品推薦、社交網絡的好友建議、人臉識別、圖像識別、自然語言理解、機器翻譯、語音識別、無人機跟蹤技術、汽車自動駕駛等等。
很明顯,未來的10年內,越來越多的應用場景會裝配上人工智能,而且機器會不斷學習,做得越來越好。
通用人工智能
Deepmind和其它做機器學習的科技公司的不同在于它提出來的通用人工智能(Artificial General Intelligence)的概念和產品。通用人工智能背后的技術是深度強化學習,其主要有兩個特點,一是端對端(end-to-end)的學習,二是自適應, 無需人類調參而勝任不同的任務。
Deepmind之前推出的玩街機游戲的通用人工智能技術就完美地詮釋了這兩個特點。
首先,機器的輸入直接是游戲屏幕的像素,不需要任何特征設計和編碼。這里要歸功于最近4年來名聲大噪的深度學習技術。深度學習通過建立較深層數的人工神經網絡模型,使機器能夠自動從原始輸入信息中提取、學習出適用于預測、決策的高層特征。
例如在人臉識別這一場景中,深度卷積網絡(deep convolutional networks)輸入層得到圖片像素本身,底層網絡學習出點、直線、曲線、拐角等初級特征,中層網絡在這些點、線、角的基礎上學習出眼睛、鼻子、嘴等器官特征,高層網絡則進一步組合這些器官特征判斷出圖片是否包含人臉。
其次,同樣設置的機器可以做不同的任務,只要“喂”進去的數據不同,無需人類調參或者只需要極小的人類工作花銷。Deepmind使用同一個深度Q學習網絡(DQN,deep-q-network)模型可以玩不同的街機游戲,只需要讓機器玩某個游戲幾天,它就能學會并超過人類玩家。
通用人工智能可以理解為是在強化學習的框架下,結合其在不同任務下的適應性、模型零耦合(model-free)的優(yōu)勢和深度學習的特征自動提取的優(yōu)勢,實現(xiàn)出的能勝任多種任務端對端學習的超級人工智能。這已經十分接近人類學習和工作的方式了。
正是由于以上兩點優(yōu)勢,人類在開發(fā)新一代人工智能的過程中需要做的干涉越來越少,交給機器去自動完善的學習比重越來越大,這為人工智能的工作水平的提升以及在各個領域的普及帶來了本質的飛躍。