在做準備這段時間,我可以向你們介紹一下CAPTCHA全自動計算區(qū)分人與計算機系統(tǒng),也就是圖靈測試,就是抓住你了,CAPTCHA從英語說法來的,抓住你了,CAPTCHA這個項目主要是區(qū)分計算機和人類,它的有關(guān)一個程序告訴什么是計算機,什么是人,而且是全自動的,可以把它看成是一個衛(wèi)兵,它站在門口,如果要是一個人的話,那就是請進,要是電腦的話,那就對不起了,別想進來,因此,我們想搞這么一個程序,它可以允許人進來,但是把電腦排除在外。這里邊有一點自相矛盾的地方。很奇怪的這么一點,因為電腦必須要決定一個人它是人還是電腦呢?我們必須要搞這么一個程序,它能夠進行這種測試,還要給它評級評分,給測試,給表現(xiàn)人評分,可是這個方案卻通不過這個測試,多虧我多年在大學任教,所以我知道考試有多難,我知道當學生考試很難,去考學生很容易。所以它是有可能編這么一個程序的,它可以去把人和計算機區(qū)別開來,可是這個程序卻自己通不過這種測試,這是可能的,而且編制這么一個CAPTCHA也是可能的,解決比較難的問題,姚教授剛才提到量子加密的問題,根據(jù)分解的問題,分解大數(shù)是一個非常困難的復雜的問題,我們CAPTCHA也想在比較復雜的問題上進行程序編碼,我們面臨的復雜問題就是人工智能,簡稱AI。我們想根據(jù)以下來見證CAPTCHA,如果方案程序為一個電腦編制這樣一個程序,使他們通過CAPTCHA程序的話,這樣這個電腦就解決人工智能的問題了。我們現(xiàn)在尤其一些黑客經(jīng)常編寫程序,他們想電腦通過衛(wèi)兵,我們希望黑客和我們一起來解決所涉及到的人工智能的問題,今天我要講的題目是50%布朗要講的,另外一半是我學生要講的,這些是他們做的研究,CAPTCHA的程序,我只是介紹幾種可能性,CAPTCHA可能的運行方式,它有一個一千字的詞匯表,這一千字的詞匯表就是包括英語一千個字眼,我挑選額一千個字眼,因為五歲的孫子可以認識這一千個字,對我來說五歲的孫子能夠通過CAPTCHA程序是很重要的一件事,因此識別從5歲一直到80到85歲的人,因為我的媽媽是84歲,因為我們的媽媽也能夠通過CAPTCHA。它們工作的道理從一千個詞匯量挑出七個字,隨意的挑選,一旦挑出來之后,對這些字做了修改,把這些字打亂了圖形,一旦有打亂了圖形之后,你會看到測試是怎么進行的,現(xiàn)在測試就是你看到這樣一個很混亂的圖形,看一看你是不是能夠把混亂的圖形變回到最初的那七個字,這里可以看到這是打亂的圖形,這里面有七個字,包括圖形里,所以看到這里有一個門檻,你可以把它定為七個字,你可以改變這個門檻,我們從字典挑出七個字,把七個字打亂了,變成這樣一個圖形。孩子們是很敏銳的,你知道嗎,非常小的孩子,眼光非常敏銳的,不同圖形的字,有的在樹上,各種鳥的動作,他們觀察力非常敏銳,比如說你可以把字放在瓶子里,孩子都能識別出來,這是很令人驚奇的事。所以我們現(xiàn)在的識別設備卻做不到這一點,他對混雜的圖形他可以識別出來,這是很難的,這是人工智能的問題,如果有一個黑客,能夠編寫一個程序,能夠識別出這個字的話,那就更好了,這比CAPTCHA更要好,我們有一個更好字的識別系統(tǒng),這樣我們就可以閱讀美國國會的圖書館里的圖書了。
這就是我們的測試,我還想談一談它的用途。
你記得剛才向我們講述了交談間談話間的問題,怎樣把蠕蟲趕出交談間,另外他還想一個辦法,把我們的垃圾郵件從電子郵件清除出去,完全把這些趕出去,或者完全阻止他們,但是完全可以打消他們的速度,因此許多用途用于電子郵件,可以用于瀏覽和采購,這是又一個用途,這是很可怕的一個用途。美國有投票站了,在美國最好的銷售電腦的研究生院是哪里,康耐爾大學肯定是康耐爾大學,各個學校的學生投自己的票,卡奈基梅隆突然找了,你知道為什么嗎?有一個蠕蟲,投票,我們要人去投票,讓蠕蟲去做吧,他做得更好,他的票很多,幾千人,麻省理工學院又比他多了幾票,麻省理工學院比我們多了一票,不管IMT總是比我們多幾票,這都是蠕蟲搞的。因此,確定之一票是人,而不是蠕蟲,如果把蠕蟲排除出去我們就可以知道,我們確保每一個投票的人首先要通過衛(wèi)兵,什么是CAPTCHA呢,CAPTCHA是一個程序,可以區(qū)別用戶是計算機還是人,我們現(xiàn)在把計算機和人區(qū)別開來,電腦想把人和計算機區(qū)別來,因此CAPTCHA可以做這樣的測試,大多數(shù)可以通過這個測試,但是現(xiàn)在目前的電腦通不過這個測試。而且我想計算機絕對不可能比我們?nèi)祟愃械氖虑槎急任覀冏龅煤?,這就是我們對計算機的總結(jié),實際上它有點像這種系統(tǒng),是自動化,是一種程序,而且是公開的程序,我們把它所有的程序共同上我們的網(wǎng)站來看一看我們的CAPTCHA是怎么工作的,完完全全是變化的,圖靈測試通過一種測試把人和計算機區(qū)分開來,而且我們大家應該記住,是如何上網(wǎng)站,因為它P拼寫稍微有點怪。P是原代碼,說明我們的原代碼應該是公開的。為什么要把它公開呢?下面有一些原因。首先把它公開以后,把CAPTCHA設計師能夠加以關(guān)注,當你通過測試的時候,你可以看一看某些單詞是單詞的程序,有欺詐傾向的人民才能夠看一看CAPTCHA程序是怎么樣工作的,因此最好的辦法是把它公開,所以我們所有的數(shù)據(jù)都是公開的。還有其它的原因。