交易股票、定位廣告受眾、指導(dǎo)政治宣傳、安排約會(huì)、在電視問答節(jié)目《危險(xiǎn)邊緣》(Jeopardy)中擊敗對(duì)手,甚至是選擇胸罩尺寸:計(jì)算機(jī)算法正在包攬所有這些工作,甚至還覆蓋到了更多領(lǐng)域。
但在幕后,一位老幫手無疑正在發(fā)揮越來越重要的作用,那就是人類。
雖然算法正變得前所未有地強(qiáng)大,快而精準(zhǔn),但計(jì)算機(jī)本身卻往往只懂字面義,它們通常無法理解不同語境和詞義的微妙差別。盡管這些機(jī)器如此強(qiáng)大,但它們也并非總是能解讀人類語言的含糊性和人類邏輯的神秘性。然而如今,它們卻被要求得出更符合人類的習(xí)慣的結(jié)果。
“雖然電腦十分聰明,但它們?nèi)匀豢赡軙?huì)愚不可及,”卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)的計(jì)算機(jī)科學(xué)家湯姆·M·米切爾(Tom M. Mitchell)說。
因此,雖然編程專家們還在編寫計(jì)算機(jī)代碼一步步的操作指令,但還是需要額外的人力進(jìn)行一些更細(xì)致的工作,因?yàn)橛?jì)算機(jī)所處理的工作正變得越來越復(fù)雜。人們要評(píng)估、編輯或者校正算法完成的工作。或者,人們也會(huì)集合起在線知識(shí)的數(shù)據(jù)庫(kù),并對(duì)其進(jìn)行檢查、核對(duì),實(shí)質(zhì)上是建立起一個(gè)讓計(jì)算機(jī)快速查找答案的備忘錄。人類可以將信息解釋、調(diào)整成電腦和其他人都可以理解的內(nèi)容。
像蘋果(Apple)的Siri和IBM的沃森(Watson)這樣的問答技術(shù),尤其需要依賴這種新興的人機(jī)合作。單靠算法本身是不足夠的。
計(jì)算機(jī)算法和工程師主導(dǎo)著谷歌(Google)的業(yè)務(wù)和文化。但即使是在這樣的公司,人對(duì)搜索結(jié)果的介入也越來越多。谷歌需要在兩個(gè)方面借助人力的幫助。從幾個(gè)月前起,如果用戶鍵入一個(gè)著名人物或地點(diǎn)的名字,如“奧巴馬”或“紐約市”,谷歌就會(huì)在搜索結(jié)果的右邊顯示信息概要。這些概要取自存儲(chǔ)知識(shí)的數(shù)據(jù)庫(kù),如維基百科(Wikipedia)、中情局世界概況(World Factbook),以及Freebase,谷歌在2010年收購(gòu)了Freebase的母公司Metaweb。這些數(shù)據(jù)庫(kù)都是由人編輯的。
當(dāng)谷歌的算法發(fā)現(xiàn)一個(gè)搜索關(guān)鍵字有匹配的概要信息存在,搜索引擎會(huì)按指令抓取信息,而不僅僅是顯示網(wǎng)頁(yè)鏈接。
谷歌負(fù)責(zé)搜索質(zhì)量的技術(shù)總監(jiān)斯科特·赫夫曼(Scott Huffman)說,“我們的想法發(fā)生了變化。人類對(duì)我們的部分信息資源進(jìn)行了更多的整理。”
其他的人類助手有評(píng)估員和打分員,他們幫助谷歌對(duì)其搜索算法做微調(diào)處理。谷歌的搜索算法自動(dòng)運(yùn)行、能力強(qiáng)大,每月能處理1000億條搜索請(qǐng)求。谷歌公司的赫夫曼說,“我們的工程師逐步調(diào)整算法,之后,真人幫手會(huì)幫助我們判斷所提出的變動(dòng)是否真的是對(duì)程序的改善。”
23歲的凱瑟琳·揚(yáng)(Katherine Young)是谷歌的一名打分員。她是一名合同工,也是喬治亞州梅肯的一名大學(xué)生。她會(huì)看到一條含糊的搜索關(guān)鍵字,如“國(guó)王舉著什么”,以及兩組谷歌搜索的結(jié)果。她要做的是給結(jié)果的相關(guān)性、準(zhǔn)確性和質(zhì)量打分。這條不精確的關(guān)鍵字得出的搜索結(jié)果中,排在前面的一些網(wǎng)頁(yè)鏈接都說,國(guó)王通常拿著儀式權(quán)杖,這是一個(gè)合理的結(jié)論。
揚(yáng)說,她的判斷“并非完全非黑即白,其中一些是主觀的”。她補(bǔ)充說,“你得盡量站在查詢這條關(guān)鍵字的人的角度考慮。”
IBM的沃森(Watson)是一款強(qiáng)大的問答型電腦,它曾在兩年前擊敗了《危險(xiǎn)邊緣》節(jié)目的冠軍,人們近期正在訓(xùn)練它協(xié)助醫(yī)生診斷疾病。但它也需要人類的幫助。
為了幫助沃森準(zhǔn)備好協(xié)助醫(yī)生的工作,人們給它輸入醫(yī)學(xué)文獻(xiàn)、科學(xué)報(bào)告和去掉了患者身份信息的數(shù)字病例。沃森并不回答問題,而是向克利夫蘭醫(yī)學(xué)中心(Cleveland Clinic)的臨床醫(yī)生和醫(yī)學(xué)院學(xué)生提問。他們會(huì)通過一項(xiàng)叫“教導(dǎo)沃森”(Teach Watson)的功能給出答案,并糾正電腦的錯(cuò)誤。
FindTheBest是加州圣巴巴拉的一家快速成長(zhǎng)的初創(chuàng)企業(yè),25歲的本·泰勒(Ben Taylor)是該公司的一名產(chǎn)品經(jīng)理。這家公司自稱是一部“對(duì)比引擎”,可以找到并對(duì)比超過100個(gè)主體和產(chǎn)品,包括從大學(xué)到養(yǎng)老院、從智能手機(jī)到狗的品種的各種話題。網(wǎng)站于2010年上線,該公司現(xiàn)在有60名全職員工。
泰勒幫助設(shè)計(jì)和編輯該網(wǎng)站的教育板塊。他學(xué)的是英語專業(yè),并非工程師,而是自學(xué)成才,成了從教育部門及其他領(lǐng)域的研究中發(fā)掘隱秘?cái)?shù)據(jù)的專家。他的研究方法包括通過談話和電子郵件與教育者交流。他是一名信息偵探。
在FindTheBest網(wǎng)站上,根據(jù)地理位置、科目和學(xué)費(fèi)等不同標(biāo)準(zhǔn),人們可以迅速找到超過8500所學(xué)院的信息。打開一所大學(xué)的頁(yè)面,摘要、圖表和圖片也會(huì)展示出豐富的信息,甚至包括全體師生的性別比例和種族構(gòu)成。