參與:吳攀、晏奇
至少?gòu)目谔?hào)上來(lái)說(shuō),我們一直在追求「人人平等」,但我們也都清楚我們離這一目標(biāo)還相去甚遠(yuǎn),部分原因是因?yàn)槭澜绮⒉皇瞧降?,還有一部分原因是我們的頭腦里都還存在著偏見(jiàn)。現(xiàn)在隨著人工智能技術(shù)的發(fā)展,機(jī)器已經(jīng)開(kāi)始具備了學(xué)習(xí)能力,那么它們?cè)趯W(xué)習(xí)各種技能的同時(shí)也會(huì)學(xué)會(huì)人類的偏見(jiàn)嗎?于本周發(fā)行的新一期Science期刊上就刊登了一項(xiàng)有關(guān)的研究結(jié)果,其表明人工智能也能習(xí)得人類的種族和性別偏見(jiàn)。機(jī)器之心在這里編譯了Science網(wǎng)站上對(duì)于該研究的介紹以及該報(bào)告的摘要和部分結(jié)果,相關(guān)原文請(qǐng)點(diǎn)擊「文末閱讀」原文查閱。
地址:http://science.sciencemag.org/content/356/6334/183.full
學(xué)習(xí)人類書(shū)寫(xiě)的文本的計(jì)算機(jī)會(huì)自動(dòng)表現(xiàn)出特定的男性或女性職業(yè)詞
人工智能的一個(gè)偉大愿景是創(chuàng)造一個(gè)沒(méi)有偏見(jiàn)的世界。人們想著,如果讓算法來(lái)招聘員工,那么男人和女人都應(yīng)該會(huì)有同等的工作機(jī)會(huì);如果用大數(shù)據(jù)來(lái)預(yù)測(cè)犯罪行為,那么就會(huì)消除警務(wù)工作中的種族偏見(jiàn)。但現(xiàn)實(shí)往往會(huì)給理想當(dāng)頭棒喝,最近一項(xiàng)新研究表明計(jì)算機(jī)也可以產(chǎn)生偏見(jiàn),尤其是當(dāng)計(jì)算機(jī)向人類學(xué)習(xí)時(shí)。當(dāng)算法通過(guò)分析處理大量人類書(shū)寫(xiě)的文本來(lái)學(xué)習(xí)詞句的含義時(shí),它們也會(huì)獲得類似于我們的偏見(jiàn)那樣的刻板印象。
「不要把人工智能看作是什么仙女教母,」該研究的聯(lián)合作者、英國(guó)巴斯大學(xué)和普林斯頓大學(xué)的計(jì)算機(jī)科學(xué)家Joanna Bryson說(shuō),「人工智能只是我們已有文化的延伸。」
這項(xiàng)研究的靈感來(lái)自于一種被稱為內(nèi)隱聯(lián)想測(cè)驗(yàn)(IAT:implicit association test)的心理學(xué)工具。在IAT中,詞匯會(huì)在一個(gè)計(jì)算機(jī)屏幕上閃現(xiàn),人們對(duì)其做出反應(yīng)的速度能夠表明其潛意識(shí)的聯(lián)想。比如在測(cè)試中,黑人和白人美國(guó)人在將 Brad 和 Courtney(通常是男性名字)與 happy 和 sunrise(積極詞匯)聯(lián)想到一起以及將 Leroy 和 Latisha(通常是女性名字)與 hatred 和 vomit(消極詞匯)聯(lián)想到一起時(shí)的反應(yīng)速度會(huì)更快,反過(guò)來(lái)則更慢。
為了測(cè)試機(jī)器「心智」中的類似偏見(jiàn)(bias),Bryson 及其同事開(kāi)發(fā)了一種詞嵌入關(guān)聯(lián)測(cè)試(WEAT:Word-Embedding Association Test)。他們首先基于一個(gè)詞通常出現(xiàn)的語(yǔ)境而構(gòu)建了一個(gè)詞嵌入(詞嵌入基本上可以看作是計(jì)算機(jī)對(duì)詞的定義)集合。比如,「冰」和「蒸汽」有類似的嵌入,因?yàn)檫@兩個(gè)詞的語(yǔ)境中常常出現(xiàn)「水」這樣的詞,而不會(huì)常出現(xiàn)「時(shí)尚」這樣的詞。但對(duì)于一臺(tái)計(jì)算機(jī)而言,一個(gè)嵌入常常被表示成一個(gè)數(shù)字串,這不是人類所能直觀理解的定義。斯坦福大學(xué)的研究者通過(guò)分析互聯(lián)網(wǎng)上的數(shù)千個(gè)詞而為本研究提供了分析用的詞嵌入,具體方法可參閱論文《GloVe: Global Vectors for Word Representation》。
WEAT 會(huì)計(jì)算那些數(shù)字串之間的相似度,而不是去測(cè)量人類的反應(yīng)時(shí)間。通過(guò)這個(gè)方法,Bryson 的團(tuán)隊(duì)發(fā)現(xiàn),諸如「Brett」和「Allison」這樣的名字的嵌入會(huì)與那些涉及到「愛(ài)」與「歡笑」這樣的積極詞匯更相似,而諸如「Alnozo」和「Shaniqua」這樣的名字會(huì)與如「癌癥」、「失敗」這樣的消極詞匯更加相似。對(duì)計(jì)算機(jī)而言,偏見(jiàn)內(nèi)置于詞之中。
平均起來(lái),IAT 表明:在美國(guó),男人會(huì)和工作、數(shù)學(xué)、科學(xué)聯(lián)系起來(lái),而女人會(huì)和家庭、藝術(shù)聯(lián)系起來(lái)。年輕人通常會(huì)被認(rèn)為比年長(zhǎng)者更加快樂(lè),所有的這些聯(lián)系都由 WEAT 發(fā)現(xiàn)。通過(guò)使用同樣的技術(shù)來(lái)測(cè)量它們那些嵌入的積極和消極詞匯的相似度,該程序也推斷認(rèn)為,花會(huì)比昆蟲(chóng)、樂(lè)器和武器更快樂(lè)。
隨后,研究者開(kāi)發(fā)了一個(gè)詞嵌入真實(shí)關(guān)聯(lián)測(cè)試(word-embedding factual association test,WEFAT)。該測(cè)試會(huì)決定詞匯與詞匯之間關(guān)聯(lián)的強(qiáng)度,然后對(duì)比那些關(guān)聯(lián)與真實(shí)世界中事實(shí)的強(qiáng)度。例如,它會(huì)去尋找「hygienist」和「librarian」這樣的嵌入詞與如「female」和「woman」這樣的詞的關(guān)聯(lián)強(qiáng)弱。對(duì)每個(gè)職業(yè)來(lái)說(shuō),該程序接下來(lái)會(huì)拿這個(gè)計(jì)算機(jī)生成的性別關(guān)系關(guān)聯(lián)測(cè)量結(jié)果與女性實(shí)際在那個(gè)領(lǐng)域的占比進(jìn)行比較。我們發(fā)現(xiàn),結(jié)果高度相關(guān)。因此,該團(tuán)隊(duì)表示,嵌入可以對(duì)從花到種族和性別偏見(jiàn)的常見(jiàn)情緒、甚至是關(guān)于勞動(dòng)力的事實(shí)等所有東西進(jìn)行編碼。