科技訊4月21日消息,國外科技網(wǎng)站Backchannel撰文稱,我們的機器如今擁有我們無法理解的知識。我們正日益依靠能夠自行創(chuàng)造出模型來得出結(jié)論的機器,但那些模型往往超出人類的理解范疇,會以不同于我們的方式來“思考”這個世界。
以下是文章主要內(nèi)容:
“海量數(shù)據(jù)的可用性,以及用來分析這些數(shù)據(jù)的統(tǒng)計工具,帶來了全新的理解世界的方式。相互關(guān)系取代因果關(guān)系,即便沒有一致的模型、統(tǒng)一的理論或者機械論解釋,科學(xué)也能夠取得進展。”
《連線》前總編輯克里斯·安德森(Chris Anderson)在2008年如是寫道。當(dāng)時這引發(fā)了一番激烈的爭論。例如,有篇刊登在分子生物學(xué)期刊的文章問道,“……如果我們停止去尋找模型和假說,那我們所做的還是科學(xué)嗎?答案顯然應(yīng)該是‘不。’”
但如今——與安德森的文章相隔還不到10年時間——該爭議聽起來很怪異。在我們?nèi)碌膹姶蟮木W(wǎng)絡(luò)化硬件的助力下,計算機軟件的種種進展正使得計算機不僅僅能夠不用模型(表達系統(tǒng)元素如何相互影響的規(guī)則集)就能運作,還能夠生成自己的模型,盡管那些模型看上去可能不大像是人類創(chuàng)造的。隨著各家科技公司紛紛“以機器學(xué)習(xí)為先”,這甚至在變成標(biāo)準的方式。
我們正日益依靠能夠自行創(chuàng)造出模型來得出結(jié)論的機器,但那些模型往往超出人類的理解范疇,會以不同于我們的方式來“思考”這個世界。
但這也帶來了代價。如此引用異類智能,正引發(fā)我們對長久以來的西方傳統(tǒng)中植入的假設(shè)思維的疑問。我們原來認為知識關(guān)乎在混亂中找出秩序來。我們原來認為知識關(guān)乎簡化這個世界。現(xiàn)在看來我們似乎是錯誤的。認識這個世界或許需要我們放棄去理解它。
超出人類理解范疇的模型
在有關(guān)機器學(xué)習(xí)的系列文章中,亞當(dāng)·蓋特吉(Adam Geitgey)解釋了基礎(chǔ)內(nèi)容,從中可以看出這種新式的“思維”:
“有泛型算法能夠告訴你一組數(shù)據(jù)有趣的地方,而且你完全不必針對問題編寫任何的自定義代碼。你給泛型算法注入數(shù)據(jù),而不是編寫代碼,然后它就會根據(jù)那些數(shù)據(jù)建立自己的邏輯。”
舉例來說,你給機器學(xué)習(xí)系統(tǒng)提供數(shù)千個潦草的手寫“8”掃描照,然后它會學(xué)習(xí)在新的掃描照中辨認“8”。它并不是通過得出我們所知道的規(guī)則(比如“8由上下兩個圓圈堆疊而成”)來辨認,而是通過尋找以數(shù)字矩陣呈現(xiàn)的復(fù)雜的暗像素模式——對于人類來說這項任務(wù)頗為艱巨。農(nóng)業(yè)中最近也有個例子:同樣的數(shù)字模型技術(shù)讓計算機懂得了如何去將黃瓜分類。
接著,你可以通過打造用軟件模擬人腦處理信號的過程的人工神經(jīng)網(wǎng)絡(luò),來讓機器學(xué)習(xí)更進一步。不規(guī)則網(wǎng)絡(luò)的節(jié)點會根據(jù)從與其連接的節(jié)點而來的數(shù)據(jù)進行開啟或者關(guān)閉;那些連接有不同的權(quán)重,因此有的連接開啟相鄰節(jié)點的概率會高于其它的連接。盡管人工智能網(wǎng)絡(luò)可追溯到1950年代,但它們現(xiàn)在才形成氣候,這得益于計算性能、存儲和數(shù)字運算的進步。這一日益復(fù)雜的計算機科學(xué)分支可能會引發(fā)這樣的結(jié)果:經(jīng)過如此多層神經(jīng)網(wǎng)絡(luò)的作用,深度學(xué)習(xí)在如此多不同的條件下根據(jù)如此多不同的變量得出大量的結(jié)果,人類會無法理解計算機自行打造的模型。
但這種模式是可行的。谷歌的AlphaGo項目正是這么擊敗世界排名第三的圍棋大師的。給機器設(shè)計程序玩圍棋可比讓它去給黃瓜分類要艱巨得多,畢竟圍棋潛在的變化數(shù)達到10的350次方;國際象棋潛在的變化數(shù)達到10的123次方,宇宙中有10的80次方個原子。谷歌的硬件配置也不算特別驚人:它只有48個處理器,外加8個圖形處理器,這些剛好足夠進行所需的運算。
AlphaGo接受了發(fā)生于人類棋手16萬盤棋3000萬步棋的訓(xùn)練,期間需要注意人類選手所采取的招式,以及理解什么才算合規(guī)的下法,以及其它的基本規(guī)則。通過使用深度學(xué)習(xí)技術(shù)來定義神經(jīng)網(wǎng)絡(luò)層識別出的模式,該系統(tǒng)訓(xùn)練自己理解怎么下獲勝概率最高。