谷歌有一個(gè)雄心勃勃的計(jì)劃,那就是使用人工智能來(lái)刪除侮辱性評(píng)論以及抵御網(wǎng)絡(luò)暴民。雖然目前的技術(shù)無(wú)法應(yīng)對(duì)這樣的挑戰(zhàn),但是它有助于完善那些已經(jīng)非常規(guī)范的互聯(lián)網(wǎng)社區(qū)。
人類已經(jīng)破壞了互聯(lián)網(wǎng)。網(wǎng)絡(luò)欺凌、騷擾性評(píng)論、社會(huì)羞辱和令人反感的言論像瘟疫一樣在諸如Twitter和Reddit等網(wǎng)站蔓延,尤其是當(dāng)你碰巧引起了錯(cuò)誤的關(guān)注的時(shí)候更是如此。
提供在線服務(wù)的公司則處在被人們指控漠視騷擾性言論和壓制言論自由中間。但是,現(xiàn)在谷歌認(rèn)為,可以使用人工智能來(lái)減少這種數(shù)字化評(píng)論帶來(lái)的悲劇。該公司的技術(shù)孵化器Jigsaw(其前身為谷歌智庫(kù)Google Ideas)正打算通過(guò)一款自動(dòng)化程序Conversation AI來(lái)識(shí)別并刪除數(shù)字騷擾信息。
正如Jigsaw負(fù)責(zé)人Jared Cohen所說(shuō),“我想利用我們擁有的最好的技術(shù)去處理那些引戰(zhàn)帖和非正當(dāng)戰(zhàn)術(shù)(這些非正當(dāng)手段使得那些敵對(duì)聲音占據(jù)了不相稱的比例),并且盡我們所能來(lái)提供一個(gè)公平的環(huán)境”。
谷歌此舉彰顯了其果敢的一面,而且這項(xiàng)計(jì)劃與Jigsaw之前的工作有所差異。Jigsaw之前的工作包括推出Project Shield(免費(fèi)的開(kāi)放式DDoS攔截服務(wù)),旨在保護(hù)新聞網(wǎng)站和促進(jìn)言論自由的網(wǎng)站免受拒絕服務(wù)的攻擊。Jigsaw的另一項(xiàng)成果Password Alert是一個(gè)Chrome插件,旨在確保用戶密碼安全,免受網(wǎng)絡(luò)釣魚攻擊。
這些都曾是主要的技術(shù)挑戰(zhàn),但引戰(zhàn)帖和網(wǎng)絡(luò)暴民儼然也已成為一個(gè)社會(huì)學(xué)問(wèn)題。
Conversation AI是谷歌“moonshot”項(xiàng)目中最成功的項(xiàng)目之一,是“Google Brain”的一個(gè)分支。一方面,Conversation AI已經(jīng)通過(guò)大規(guī)模神經(jīng)網(wǎng)絡(luò)為機(jī)器學(xué)習(xí)領(lǐng)域帶來(lái)了革命性的發(fā)展,同時(shí)也使得谷歌具有更多的優(yōu)勢(shì),例如在圖像識(shí)別領(lǐng)域比人類更加熟練。但對(duì)于在線辱罵性言論,Conversation AI卻無(wú)能為力。
雖然Jigsaw的目標(biāo)是“打擊網(wǎng)絡(luò)暴民的崛起”,但是該程序本身目前卻太過(guò)溫和,因此目前Jigsaw離成為一個(gè)合格的項(xiàng)目還有一段距離。Conversation AI將會(huì)主要用于簡(jiǎn)化社區(qū)審查過(guò)程(這一過(guò)程目前主要由人類完成),因此即使無(wú)法根除那些糟糕的網(wǎng)絡(luò)行為,它也可以為一些網(wǎng)站積累更多更好的言論。
暗示性言論的檢測(cè)
數(shù)月之后,Jigsaw將會(huì)率先將Conversation AI應(yīng)用在《紐約時(shí)報(bào)》網(wǎng)站上,以幫助該公司管理其在線評(píng)論。目前,《紐約時(shí)報(bào)》主幾乎要審查每一條發(fā)布在其網(wǎng)站上的評(píng)論。
而現(xiàn)在,Conversation AI正在閱讀其中的1800萬(wàn)條評(píng)論,并從中學(xué)習(xí)如何檢測(cè)被拒絕的評(píng)論,包括沒(méi)有實(shí)質(zhì)性內(nèi)容的評(píng)論、偏離主題的評(píng)論、垃圾內(nèi)容、具有煽動(dòng)性、攻擊性的評(píng)論、包含淫穢信息的評(píng)論等。
《紐約時(shí)報(bào)》的目標(biāo)并非盡量減少其評(píng)論中的辱罵性言論,因?yàn)檫@個(gè)問(wèn)題目前已經(jīng)在掌控之中;相反,《紐約時(shí)報(bào)》希望借此來(lái)減少人工版主的工作量。“我們并未奢望有一個(gè)完全自動(dòng)化的系統(tǒng)。”《紐約時(shí)報(bào)》社區(qū)團(tuán)隊(duì)工程經(jīng)理Erica Greene說(shuō)。
《紐約時(shí)報(bào)》社區(qū)編輯Bassey Etim估計(jì),最終大約50%~80%的評(píng)論可以實(shí)現(xiàn)自動(dòng)審查,從而使得人工版主能夠?qū)⒏嗟木τ糜谄渌糠帧?/p>
與實(shí)時(shí)免費(fèi)網(wǎng)站Twitter和Reddit不同,《紐約時(shí)報(bào)》網(wǎng)站面臨另一些問(wèn)題。考慮到目前機(jī)器學(xué)習(xí)的局限性,Conversation AI還無(wú)法有效打擊存在于網(wǎng)絡(luò)空間中的辱罵性言論。
盡管機(jī)器學(xué)習(xí)已經(jīng)取得了耀眼的成就,但是它仍然沒(méi)有破解人類語(yǔ)言。人類語(yǔ)言中的那些類似于圍棋或者圖像中的圖案的部分,證明了語(yǔ)言的難以捉摸。
辱罵性言論檢測(cè)中的語(yǔ)言難題是語(yǔ)言的語(yǔ)境。Conversation AI的評(píng)論分析并不適用于一個(gè)完整的討論過(guò)程,因?yàn)樗豢梢詫蝹€(gè)的評(píng)論和學(xué)習(xí)模式中的評(píng)論來(lái)進(jìn)行匹配,從而識(shí)別哪些是好評(píng)論或者壞評(píng)論。
例如,如果評(píng)論傾向于包含常用詞匯、短語(yǔ)和其他特征時(shí),這些評(píng)論就會(huì)被認(rèn)為是可接受的。但據(jù)Greene介紹,谷歌的系統(tǒng)經(jīng)常會(huì)將關(guān)于唐納德·特朗普(Donald Trump)的文章中的評(píng)論視為辱罵性的言論,因?yàn)樗麄儠?huì)引用特朗普的一些言論,而這些言論如果出現(xiàn)在讀者的評(píng)論中通常都會(huì)被屏蔽。對(duì)于這些類型的文章,《紐約時(shí)報(bào)》將會(huì)選擇關(guān)閉自動(dòng)審核機(jī)制。