Andrej Karpathy 知道和人工智能比賽時的感受。
他第一次和人工智能正面對抗是在 2011 年。當(dāng)時斯坦福大學(xué)的一群研究人員剛剛制造出全世界效果最好的圖像識別軟件,而他想看看自己的大腦與他們的數(shù)字造物在進(jìn)行標(biāo)準(zhǔn)圖像識別測試時有多大優(yōu)勢。
斯坦福大學(xué)的軟件分析了一個由近 5 萬張圖片組成的圖片庫,將每一張圖片歸為十類中的一類,如“狗”,“馬”和“卡車”等。軟件當(dāng)時的識別準(zhǔn)確度大約為 80%。Karpathy 進(jìn)行了同樣的測試,以 94% 的準(zhǔn)確度完敗人工智能。Karpathy是斯坦福大學(xué)的研究生,他以為在很長一段時間內(nèi),人類都能這類測試中勝過機(jī)器。Karpathy 在一篇提及人工智能算法的博文中說道:
“人工智能算法的準(zhǔn)確度很難超過 80%,不過我猜還是可以將準(zhǔn)確度提高到 85% 至 90%。”
但他錯了。
去年,Google研究人員搭建了一個系統(tǒng),在更復(fù)雜的ImageNet圖像識別測試中達(dá)到93.4% 的準(zhǔn)確度。Karpathy 與斯坦福大學(xué)的一些同事一道,又與這一系統(tǒng)進(jìn)行了正面對抗。不過這次,他們的準(zhǔn)確度在一開始只達(dá)到了 85%。
2011 年的測試并不能與 ImageNet 相提并論,但重要的是:人類在 2011 年能輕易地打敗人工智能軟件;現(xiàn)在卻不行了。絕對沒有希望獲勝。
這個故事可以延伸很遠(yuǎn),從Google到 Facebook,從 IBM 到百度,到處洋溢著對目前人工智能的興奮之情。這些巨頭都在一個名為深度學(xué)習(xí)的新興領(lǐng)域投入巨資,深度學(xué)習(xí)是按照大腦積累知識的方式進(jìn)行建模。自 2013 年以來,ImageNet 競賽的冠軍都是深度學(xué)習(xí)算法,而且其在語音識別、視頻識別乃至金融分析中都有驚人表現(xiàn)。
加州大學(xué)伯克利分校教授、人工智能專家 Stuart Russell 表示,這讓人工智能領(lǐng)域為之震動,因為以前人們長期認(rèn)為不可能被計算機(jī)解決的問題突然被計算機(jī)解決了。
換言之,計算機(jī)還有很多東西要學(xué)。
人工智能訓(xùn)練營
Karpathy 及其同事被Google的系統(tǒng)完虐的原因之一是,ImageNet 處理狗等事物的方式。在 Karpathy 參加 2011 年的測試時,只有一個狗的類別。但在 2014 年,ImageNet需要你分辨出 200 種狗。
也就是說,Karpathy 必須知道羅得西亞脊背犬和匈牙利獵犬(這都什么狗...)之間的區(qū)別。
“當(dāng)我看到所有這些狗的照片時,我的感覺是‘噢,不!在機(jī)器認(rèn)出這張圖片時,我還在忙著確認(rèn)這只狗的品種’。”
因此,Karpathy 參加了自己制作的人工智能訓(xùn)練營,在這一過程中成了鑒定狗品種的小權(quán)威。兩周后,在經(jīng)過 50 個小時隨機(jī)點擊圖片的培訓(xùn)和測試后,他贏了機(jī)器。Karpathy 在測試中的準(zhǔn)確度達(dá)到了 94.9%,比Google的軟件高 1.7%。
人類又勝利了一次,不過勝得并不輕松。Karpathy 表示道:
“比賽讓我有點精疲力竭,但我覺得知道人類的準(zhǔn)確度很重要。”
抽象思維
與此同時,Karpathy 及其同事希望人工智能可以提高。他們正在研究如何消除人工智能系統(tǒng)中的缺陷,在試圖了解計算機(jī)的性能能否達(dá)到人類水平的同時,也在嘗試分析它們的錯誤。
在測試時,如果出現(xiàn)抽象圖片,Karpathy 基本上都能打敗機(jī)器。比如,人類能立刻判斷出一張圖片上是不是描繪了弓。Karpathy 還能認(rèn)出鹽罐上的“salt shaker”字樣,明白看到的東西,而計算機(jī)不是很擅長處理抽象事物。
計算機(jī)也不擅長識別 3D 圖像。計算機(jī)也許能識別杰克羅素梗犬,但要測算其大小,或者弄清楚它與同一房間中其他物體的相對位置,就是另一碼事了。這也是Google所夢寐以求解決的問題之一,他們希望計算機(jī)能像人類一樣識別圖片中的深度和微妙之處。
下一次,人類還能戰(zhàn)勝人工智能嗎?
via wired