一篇論文引發(fā)的爭議
近日,上海交大教授武筱林在國外論文數(shù)據(jù)庫中上傳了一篇論文,講述其帶領(lǐng)團隊用人工智能算法鑒別“清純”美女和“妖艷”美女,并且準確率達到了80%以上。這本是一篇正常的學術(shù)論文,但國內(nèi)外各方對此的反應不淡定了,就像武筱林團隊對美女做出“褒”和“貶”的標簽一樣,輿論各方對此也是各抒己見。
那么,這場爭議到底是蓄意炒作還是學術(shù)爭論?究竟是什么原因讓這個學術(shù)問題上升到輿論問題?武筱林團隊做的這項研究是否權(quán)威,是否能有說服力?研究過程中用到的技術(shù)算法是什么?機器判斷“清純”與否的標準是什么,會不會加入研究團隊的主觀意識呢?技術(shù)最終落地到產(chǎn)品,如果這項技術(shù)能夠應用到實際中,其應用場景又有哪些呢?下面智能菌帶你一探究竟。
情人眼里出西施?機器視覺還能幫你出"東施"
對于選美,自古就有“情人眼里出西施”的諺語,而在12月23日,上海交大教授武筱林將研究論文Automated Inference>
武筱林介紹稱,目前人臉識別技術(shù)已經(jīng)能夠成功鑒別人類的性別、種族、年齡等生物性特征,那么對于識別人類的情感、性格等社會性特征,人臉識別技術(shù)能否進行推測鑒別呢?對于這篇論文引發(fā)的爭議,武筱林或許有所準備,因為就在前不久他還發(fā)表了一份論文,講述的是通過機器識別成年男子“罪犯”與“非罪犯”的類型,識別準確率高達86%。“罪犯”與“非罪犯”的標簽相較于褒貶而言,更多的是對一個人社會屬性的審判,此處智能菌更關(guān)心的是那高達14%的出錯率。消息一經(jīng)推出便引起了巨大的爭議,而其中質(zhì)疑和否定的居多。
既然有了前車之鑒,武筱林團隊為何還要進行類似觸及社會倫理的敏感研究?況且第二次的研究并非機器定罪中是與否的鑒別,而是針對個人主觀因素占主要依據(jù)的審美。對此,武筱林在第二篇論文中表達了對上一篇論文引發(fā)爭論的回應:“我們不能因為社會禁忌和政治觀念,就在不加以檢驗的情況下否定這種可能性”。這樣的解釋能否說服質(zhì)疑者?還要看其研究所采用的方法和技術(shù)手段。
好不好看人說了不算?機器審美標準從何而來
據(jù)論文介紹,武筱林的研究團隊先是從搜索引擎中按照關(guān)鍵詞獲取照片,再人工進行排查,最后獲取3954張美女照片,其中標記為清純、柔美、甜美、單純等褒義標簽的照片為2000張,而標記為嬌艷、俗氣、風騷、輕浮等貶義標簽的照片為1954張,分別以S1和S0代替分組。對于如何確定照片屬于褒義標簽還是貶義標簽,除了按照搜索引擎的獲取外,研究人員讓22名男性研究生受訪者對照片進行人工判斷。
這是獲取的樣本,同時也是訓練機器、做測試用的數(shù)據(jù)。研究團隊采用深度卷積神經(jīng)網(wǎng)絡(CNN)對樣本數(shù)據(jù)進行研究,其中80%的數(shù)據(jù)用于訓練機器,即讓機器明白哪些是褒義標簽的照片,哪些是貶義標簽的照片,10%的數(shù)據(jù)用于驗證,剩余10%的數(shù)據(jù)用于測試。最后實驗的結(jié)果是經(jīng)過數(shù)據(jù)訓練的機器對于兩類標簽的鑒別準確率達到了80.23%。
此外,為了消除照片中女性化妝對于機器的誤導,研究團隊講所有圖片調(diào)成灰階圖,機器鑒別的正確率依然達到了74.59%。由此研究團隊認為可能是化妝照片面部的對比度和飽和度對機器鑒別產(chǎn)生影響,由此猜測照片的對比度和飽和度是機器做出判斷的重要依據(jù)之一。