「這些算法發(fā)現(xiàn)了這些東西,真的很酷,」Tolga Bolukbasi 說道,他是波士頓大學(xué)大學(xué)的一位計(jì)算機(jī)科學(xué)家,現(xiàn)在正帶領(lǐng)團(tuán)隊(duì)進(jìn)行類似的研究,他們也得到了類似的結(jié)果(參考論文《男性之于計(jì)算機(jī)程序員猶如女性之于家庭主婦?對(duì)詞嵌入的去偏見化(Man is to Computer Programmer as Woman is to Homemaker? Debiasing Word Embeddings)》地址:http://suo.im/3HFsJE)?!府?dāng)你正在訓(xùn)練這些詞嵌入模型時(shí),你實(shí)際上不會(huì)明確指明這些標(biāo)簽?!巩?dāng)人們?cè)谡砗?jiǎn)歷或貸款申請(qǐng)時(shí),就會(huì)發(fā)現(xiàn)有偏見的嵌入出現(xiàn),這一點(diǎn)都不好,他說道。例如,如果一個(gè)計(jì)算機(jī)去搜索關(guān)聯(lián)「程序員」和男人這樣的計(jì)算機(jī)程序員簡(jiǎn)歷,那么男性的簡(jiǎn)歷就會(huì)突然出現(xiàn)在所有簡(jiǎn)歷的最上面。Bolukbasi 的工作聚焦在對(duì)嵌入的「去偏見」方法上,也就是說,從中移除不想要的關(guān)聯(lián)。
Bryson 還有另一個(gè)嘗試。不同于對(duì)嵌入的去偏見(因?yàn)檫@本質(zhì)上丟掉了一些信息),她更傾向于添加額外一層人類或計(jì)算機(jī)的判斷,以此來決定如何或怎樣在這些偏見之上來行動(dòng)。在雇傭程序員這個(gè)例子上,你也許會(huì)決定去設(shè)定性別的定量指標(biāo)。
人們長(zhǎng)期以來一直認(rèn)為詞的含義可以通過詞共現(xiàn)(word cooccurrences)而提取出來,「但這遠(yuǎn)不是一個(gè)可以預(yù)期的結(jié)論,」華盛頓大學(xué)心理學(xué)家 Anthony Greenwald 說,他曾在1998年發(fā)展了 IAT,并為本周發(fā)布在 Science 期刊的這篇 WEAT 論文寫了一篇評(píng)論,參閱:http://science.sciencemag.org/content/356/6334/133。他說他預(yù)計(jì)書寫(WEAT 測(cè)試的基礎(chǔ))將能更好地反映明確的態(tài)度,而不是隱含的偏見。但相反,WEAT 嵌入更接近于 IAT 偏見,而不是關(guān)于種族和性別態(tài)度的調(diào)查,這說明我們可以會(huì)以一種我們沒意識(shí)到的方式傳遞我們的偏見?!高@有些讓人吃驚,」他說。他也說 WEAT 也許可以被用于測(cè)試過去時(shí)代的隱含偏見,比如通過分析19世紀(jì)寫出的書所導(dǎo)出的詞嵌入。
與此同時(shí),Bryson 及其同事也表明即使谷歌也沒能免于偏見。當(dāng)談?wù)摰氖且晃会t(yī)生時(shí),該公司的翻譯軟件會(huì)將許多語言中性別中性的代詞翻譯成英語的「he」,如果談?wù)摰氖亲o(hù)士,那么就會(huì)將其翻譯成「she」。
所有這些研究都表明「注意你的遣詞造句是很重要的,」Bryson 說,「對(duì)我來說,這實(shí)際上就是對(duì)政治正確和平權(quán)法案等各種事情的辯護(hù)?,F(xiàn)在,我看到了它的重要性?!?/p>
以下是對(duì)該論文的摘要介紹:
論文:從語言語料庫(kù)中自動(dòng)推導(dǎo)的語義包含類似人類的偏見(Semantics derived automatically from language corpora contain human-like biases)
機(jī)器學(xué)習(xí)是一種通過在已有的數(shù)據(jù)中發(fā)現(xiàn)模式來實(shí)現(xiàn)人工智能的途徑。在這里我們的研究表明,通過將機(jī)器學(xué)習(xí)應(yīng)用于人類日常語言,其結(jié)果會(huì)具有類人化的語義偏見。通過內(nèi)隱聯(lián)想測(cè)驗(yàn)(Implicit Association Test),我們用廣泛使用的、基于來自萬維網(wǎng)中標(biāo)準(zhǔn)文本語料庫(kù)訓(xùn)練出的純數(shù)據(jù)機(jī)器學(xué)習(xí)模型復(fù)制了一系列已知的偏見。我們的結(jié)果顯示,文本語料庫(kù)包含了我們歷史偏見的持久印記,它們可恢復(fù)且非常精確,比如我們對(duì)昆蟲或花來說是否中立、對(duì)種族和性別來說是否存在問題、或者甚至就簡(jiǎn)單誠(chéng)實(shí)地反應(yīng)了職業(yè)或姓名的現(xiàn)狀分布。我們的方法有望幫助辨認(rèn)和處理文化(包括技術(shù))中的偏見來源。
表1:詞嵌入關(guān)聯(lián)測(cè)試結(jié)果總結(jié)。我們復(fù)制了8個(gè)使用詞嵌入的著名 IAT 發(fā)現(xiàn)(第 1 到 3 行和第 6 到 10 行);我們也以同樣的方式幫助解釋了有關(guān)雇傭行為的偏見(第 4 和 5 行)。其中每個(gè)結(jié)果都比較了兩組詞,這些詞來自關(guān)于我們嘗試學(xué)習(xí)的兩組屬性詞(attribute words)的目標(biāo)概念。在每一個(gè)案例中,第一個(gè)目標(biāo)是想辦法與第一個(gè)屬性兼容,第二個(gè)目標(biāo)是與第二個(gè)屬性兼容。在整個(gè)過程中,我們都使用了來自我們想要復(fù)制的研究的詞列表。N 表示 subjects 的數(shù)量,NT 表示目標(biāo)詞的數(shù)量,NA 表示屬性詞的數(shù)量。我們報(bào)告了影響大?。╠)和 P 值(有舍入),以強(qiáng)調(diào)這兩組結(jié)果的統(tǒng)計(jì)意義和實(shí)際意義都一致地高;我們并不是說我們的數(shù)字可直接與那些人類的研究進(jìn)行比較。對(duì)于在線 IAT(第 6、7、10 行),沒有報(bào)告 P 值,但已知低于 10^?2 的重要閾值。第 1 到 8 行的討論見論文。為了完整比較,這個(gè)表格還包含了兩個(gè)其它 IAT(第 9 和 10 行),這對(duì)應(yīng)于我們能找到的兩個(gè)合適的詞列表。我們發(fā)現(xiàn)了與 word2vec 類似的結(jié)果——word2vec 是另一個(gè)用于創(chuàng)建詞嵌入的算法,是在不同的語料庫(kù) Google News 上訓(xùn)練的。