本文原作者Yoshua Bengio,Yoshua Bengio教授(個人主頁)是機器學習大神之一,尤其是在深度學習這個領域。他連同Geoff Hinton老先生以及 Yann LeCun(燕樂存)教授,締造了2006年開始的深度學習復興。他的研究工作主要聚焦在高級機器學習方面,致力于用其解決人工智能問題。他是僅存的幾個仍然全身心投入在學術界的深度學習教授之一,好多其他教授早已投身于工業(yè)界,加入了谷歌或Facebook公司。
以下內(nèi)容來自于Yoshua Bengio的最新博文,本文由格靈深瞳大美女天天翻譯。
正文如下:
人類一直夢想著創(chuàng)造有智能的機器。早在第一臺可編程計算機問世前100多年,發(fā)明家就對如何能讓由連桿和齒輪組成的設備也變得更加智能這一命題充滿好奇。后來,20世紀40年代計算機領域的先驅(qū)者之一Alan Turing通過描述一個測試為計算機科學設定了目標,這個測試也就是后來被大家所熟知的圖靈測試,用以衡量計算機的表現(xiàn)和人類行為的接近程度。(注:圖靈測試一詞來源于計算機科學和密碼學的先驅(qū)Alan Turing寫于1950年的一篇論文《計算機器與智能》。Alan Turing 1950年設計出這個測試,其內(nèi)容是,如果電腦能在5分鐘內(nèi)回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則電腦通過測試。)
在我學術生涯早期研究人工智能領域的時候,科學家們解決的都是一些對人類來說困難,而對計算機來說會相對簡單的任務,比如大規(guī)模的數(shù)學計算。然而在最近幾年,我們正在進行的一些項目都是對人類來說非常容易,或者說下意識就能解決的任務,比如語音識別和人群中的人臉識別,然而這些任務卻很難讓計算機理解。
真正讓我感興趣的是在人工智能領域開始有了更為復雜的探索,即讓計算機獲得自主學習的能力。當然我的目的并不是讓計算機完全像人類一樣思考,我只是想去理解那些能讓實體、計算機或生物變得智能化的一些基礎原則。我很久以前打過一個賭,說是如果人工智能真的能夠?qū)崿F(xiàn)的話一定是得益于實體的學習能力,因此我一直專注于構建能夠?qū)W習并自行理解這個世界的計算機。
我相信此刻我們正處于人工智能甚至是計算機本身的一個歷史轉折點。得益于現(xiàn)在更為強大的計算機、可用的海量豐富數(shù)據(jù)集以及先進的算法,我們終于可以跨越一個長期以來阻礙計算機科學發(fā)展的閾值。機器學習正在從一個高度人工化的階段向另一個更為自動化的階段進行快速轉變,前者需要我們?nèi)藶榈貙γ總€項目進行設計并提取其中較好的特征,后者可以實現(xiàn)讓計算機像孩子一樣,通過不斷學習獲得的經(jīng)驗來積累內(nèi)部特征,從而理解這個世界,這就是我們所說的深度學習。
深度學習并不是一個全新的概念。事實上,在20世紀80年代我還是一個學生的時候,這是一個神經(jīng)網(wǎng)絡里的概念,也可以說是深度學習的前身,我對這個概念非常著迷并決定要在計算機科學領域開啟我的學術生涯。目前深度學習真正新的進展在于,因為之前許多科學和技術進步的積累,使得我們在人工智能應用方面取得了一系列突破,比如語音識別、計算機視覺和自然語言處理等等。這也使得這個領域內(nèi)涌入了一大批由研究生占據(jù)主要比例的研究者,讓深度學習的研究高速發(fā)展起來。
我們能走到今天離不開兩方面技術的進步,一是層次結構概念的創(chuàng)建,二是讓電腦能自己提取特征。層次結構使得電腦能通過一些簡單的概念學習進而理解復雜概念,這也是人類學習并培養(yǎng)他們對世界的理解的方式。當我們從過去所熟悉的事物中發(fā)現(xiàn)了新的觀點,就會逐漸優(yōu)化對世界理解的模型來不斷適應,這些新事物又能幫助他們更好的與事實和數(shù)據(jù)對應起來。
例如,深度學習系統(tǒng)可以通過組合一些簡單的概念來表示一只貓的形象,比如通過邊緣的概念依次定義角落和輪廓。但是我們不需要特意教它關于中間區(qū)域的概念,它會自己學習。在這樣一個視覺識別系統(tǒng)中,計算機可以成功在一張暹羅貓翻跟頭照片中識別出貓,而不需要我們展示給系統(tǒng)所有貓可能具有的顏色、外形或行為。當計算機“看見”一只貓的時候,它就會“知道”這是一只貓。