1.關(guān)于機器與人類智慧未來的分歧
2011年2月18日,超級電腦“沃森”打敗了人類,站在了與人類智力競賽的最高領(lǐng)獎臺上。著名的未來學(xué)家?guī)炱濏f爾相信,由于信息技術(shù)正朝著“超人類智能”的奇點邁進(jìn)。當(dāng)這個信息奇點在2045年到來的時候,人工智能將超越人類智慧。
但也有不少科學(xué)家認(rèn)為機器智慧超越人類智慧還只是一個科學(xué)幻想,包括麻省理工的計算機學(xué)教授羅勃?米勒(Rob Miller),F(xiàn)acebook人工智能實驗室主任、深度學(xué)習(xí)專家Yann LeCun,都認(rèn)為機器算法在一些領(lǐng)域的確超越了人類的能力范圍。 但在一些領(lǐng)域,例如對社會和文化的認(rèn)知領(lǐng)域,包括不斷發(fā)明各種新詞匯、傳播小貓的視頻并點贊,或一起參與構(gòu)的其他文化現(xiàn)象。這些是機器算法很難企及的領(lǐng)域。
1950年,圖靈發(fā)表題為《機器能思考嗎?》的論文,第一次提出“機器思維”的概念。提出假想:一個人在不接觸對方的情況下,通過一種特殊的方式,和對方進(jìn)行一系列的問答,如果在相當(dāng)長時間內(nèi),他無法根據(jù)這些問題判斷對方是人還是計算機,那么,就可以認(rèn)為這個計算機具有同人相當(dāng)?shù)闹橇?,即這臺計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)。
圖靈測試經(jīng)常用來檢驗機器是否具備人的智能,但圖靈測試受人為因素干擾太多,嚴(yán)重依賴裁判者和被測試者的主觀判斷,而且只判斷機器是否具備了人的智能,但機器與人類智慧的差距和變化速度并不能得到定量的分析 .因此往往有人宣稱其程序通過圖靈測試,例如2014年6月英國雷丁大學(xué)客座教授凱文?沃維克宣稱一款名為“尤金?古特曼(Eugene Goostman)”的計算機軟件通過了測試。但很快就被人揭發(fā)他們的測試有很大漏洞并由欺詐嫌疑,
那么有沒有一種方法,能夠定量檢測機器智力的發(fā)展水平和速度,并與人類智力進(jìn)行對比,觀察可能潛在的風(fēng)險并進(jìn)行防范。2013年以來我們在機器與互聯(lián)智商方向進(jìn)行了探索,初步成果已經(jīng)發(fā)表在2014年6月6日舉辦的ITQM會議上,下面我們將簡要介紹如何定量分析機器與人類智慧的未來之爭。
2.機器與人類智商通用測試方法(M&H IQ)
在心理科學(xué)中,智力(intelligence)是最難理解的概念之一。 目前有關(guān)智力的定義累積起來不下百種, 但一個基本共識是,智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力。
對人類智力的測量即智商測試由比奈西蒙最早提出,1905年比奈西蒙發(fā)表了《診斷異常兒童智力的新方法>>, 即比納西蒙智力量表 ,標(biāo)志著智力測驗的正式出現(xiàn)。 1916年,美國斯坦福大學(xué)教授推孟(L.M. Ter man)將比納西蒙量表介紹到美國并予以修訂,修訂之后的量表稱為斯坦福比納量表,它成為目前世界上廣泛流傳的標(biāo)準(zhǔn)測驗之一。
因為目前機器智力發(fā)展還很不完善,不能完全套用對人的智商測試。幾乎沒有任何機器系統(tǒng)能夠完成人類智商測量的操作能力測試,因此我們需要吸收以上智商測試量表的優(yōu)點,設(shè)計新的智力評價體系和建立測試題庫。使之能同時對機器系統(tǒng)和不同年齡階段的人類進(jìn)行測試。這樣得出的結(jié)果將可以定量的看出機器智慧與人類智慧的差距,通過定時測試,也可以發(fā)現(xiàn)機器智慧與人類智慧差距的變化情況。
基于“智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力”這一基本認(rèn)知,可以從知識的獲取能力(觀察能力),知識掌握能力,知識創(chuàng)新能力,知識的反饋能力(表達(dá)能力)等四大方面建立新的機器與人類通用智商評價體系,從這四個方面建立15個分測試,并采用德爾菲法對其賦予權(quán)重。
機器與人類通用智力量表(M&H IQ)
1 知識獲取能力 識別文字的能力,識別聲音的能力,識別圖片的能力
2 知識掌握能力 常識(天文,地理,歷史,物理,,,,),翻譯,計算,
3 知識創(chuàng)新能力 排列,聯(lián)想,創(chuàng)作,猜測,挑選,發(fā)現(xiàn)(規(guī)律)
4 知識的反饋能力 用文字表達(dá)的能力,用聲音表達(dá)的能力,用圖片表達(dá)的能力
具有機器智慧的程序有很多種類,其中搜索引擎具有很強的代表性,作為目前互聯(lián)網(wǎng)最重要的應(yīng)用之一,搜索引擎代表有Google,Baidu,Bing等,這些搜索引擎目前在通過各種方式不斷提高搜索引擎的智能水平。
例如 1.從只能識別文字增加到能夠識別聲音和圖片;2引入“語義理解”技術(shù),試圖理解用戶的搜索意圖;3,通過深度學(xué)習(xí),讓搜索引擎可以自動識別圖像中是什么物體。因此選擇對搜素引擎進(jìn)行智商測試并與人類進(jìn)行對比將具有典型的意義。
3.世界搜索引擎排名與機器智慧的弱點
根據(jù)機器與人類通用智力量表,可以建立機器與人類通用智商測試題庫(因為篇幅問題,本文不進(jìn)行詳細(xì)介紹),2014年5月我們利用這個測試題庫對全世界50個搜索引擎和3個不同年齡階段的人類群體進(jìn)行測試得到結(jié)果如下
排名 屬地 名稱 通用智商 排名 屬地 名稱 通用智商
1 人類 18歲 97 28 葡萄牙 sapo 12
2 人類 12歲 84.5 29 德國 lycos 12
3 人類 6歲 55.5 30 印度 khoj 10.5
4 美國 google 26.5 31 俄羅斯 Km 10.5
5 中國 Baidu 23.5 32 德國 suche 10.5
6 中國 so 23.5 33 美國 Dogpile 9
7 中國 Sogou 22 34 德國 Acoon 7.5
8 埃及 yell 20.5 35 馬來西亞 Sajasearch 6
9 俄羅斯 Yandex 19 36 印度 indiabook 6
10 俄羅斯 ramber 18 37 塞浦路斯 1stcyprus 6
11 西班牙 His 18 38 希臘 Gogreece 6
12 捷克 seznam 18 39 荷蘭 slider 6
13 葡萄牙 clix 16.5 40 挪威 Sunsteam 6
14 韓國 nate 15.75 41 英國 Excite UK 6
15 阿聯(lián)酋 Arabo 15.75 42 英國 splut 6
16 中國 panguso 15 43 俄羅斯 Rol 6
17 韓國 naver 15 44 西班牙 ciao 6
18 俄羅斯 webalta 13.5 45 德國 fireball 6
19 美國 yahoo 13.5 46 德國 bellnet 6
20 美國 bing 13.5 47 德國 slider 6
21 香港 timway 12.75 48 德國 wlw 6
22 日本 goo 12.75 49 埃及 netegypt 6
23 日本 excite 12.75 50 所羅門群島 eMaxia 6
24 中國 Zhongsou 12 51 澳大利亞 Anzswers 6
25 英國 ask 12 52 澳大利亞 Pictu 6
26 法國 voila 12 53 新西蘭 SerachNZ 6
27 法國 ycos 12
通過測試我們發(fā)現(xiàn)搜索引擎在知識的掌握能力上遠(yuǎn)遠(yuǎn)超過人類,但在知識的創(chuàng)新能力上全部得分為0. 由于知識創(chuàng)新能力在通用智商測試(M&H IQ)的權(quán)重更高,因此世界范圍的搜索引擎的總體智商大大低于人類智慧,最高的Google的智商值也不到人類6歲兒童的一半。
從上述研究還可以看出智能或智力是由不同的因素組成,例如天文,地理,歷史等常識,數(shù)學(xué)計算,語言翻譯。這些方面機器或互聯(lián)網(wǎng)已經(jīng)遠(yuǎn)遠(yuǎn)超過普通人類的能力,甚至強大到令人恐怖的地步,這也是庫茲韋爾的觀點能夠震懾住很多人的主要原因。
但我們往往忽略,除此之外,智力還包括猜測預(yù)測,排列組合,規(guī)律發(fā)現(xiàn),創(chuàng)新創(chuàng)造,偽裝欺騙等更高等級的智慧因素,而在這些方面,機器和互聯(lián)網(wǎng)表現(xiàn)的基本為0,更不用說與嬰兒比較。
從科技的發(fā)展看,低端的智能,機器的能力突飛猛進(jìn),高端的智能,機器的能力舉步維艱,數(shù)十年來毫無進(jìn)展,未來的智慧世界應(yīng)該是機器與人類的分工,低端重復(fù)性的智能由機器承擔(dān),高端的創(chuàng)造性的智能由人類來承擔(dān)。過分的宣揚機器智慧超越人類智慧,正如Facebook人工智能實驗室主任Yann LeCun所說“人工智能的每一個新浪潮,都會帶來這么一段從盲目樂觀到不理智最后到沮喪的階段。未來學(xué)家生來就愿意做出盲目的預(yù)測,尤其是他們特別渴望這個預(yù)測成真的時候,可能是為了實現(xiàn)個人抱負(fù)。”,
最后需要指出,目前建立的機器與人類通用智商測試量表(M&H)還有很大的改進(jìn)空間,但希望這是一個起點,能夠解決圖靈測試的不足和缺陷,為定量分析機器智慧能否超越人類智慧打下初步的基礎(chǔ)。
(劉鋒供網(wǎng)易科技專稿,轉(zhuǎn)載請注明出處。文章僅代表個人觀點。)
(作者簡介:劉鋒,互聯(lián)網(wǎng)X實驗室創(chuàng)始人,互聯(lián)網(wǎng)進(jìn)化論作者)