2月22日消息 據(jù)連線雜志網(wǎng)站報道,科研流程一般如下:你對大千世界中的一個細節(jié)產(chǎn)生好奇。你做出假設,進行試驗,最終收集到足夠的數(shù)據(jù)來支持或反駁你的假設。以上是科研中有趣的部分,接下來的工作就不那么輕松了:你要寫一篇論文,提交到學術期刊,然后在同行評審環(huán)節(jié)中忍受一群同領域的匿名專家對你工作質量的百般刁難。
同行評審有其缺陷。人類(即便是科學家)會有偏向性,懶惰和自私。而且即使是科學工作者,有時候數(shù)學也會不很靈光。所以不可避免的,一些人想要將人工從同行評審中剔除,以人工智能取而代之。計算機以其公正、不知疲倦和無自我身份定位著稱,而且它們在本質上精通算數(shù)??茖W家并不只是干等著二進制大腦來參與科研同行評審,期刊出版商已經(jīng)在著手將之建立。
最近,一個名為“ScienceIE”的競賽為程序開發(fā)者設下挑戰(zhàn)。參賽團隊需要開發(fā)程序,要求這些程序能夠從科學論文的句子中提取基本事實,并將其同其他論文所提取的基本事實進行比較。“我的項目的大目標是幫助科學家和從業(yè)者更快速地獲得有關其研究領域的知識。”倫敦大學學院博士后AI研究員Isabelle Augenstein說,正是她設計了這個競賽。
競賽涉及到處理自然人類語言,這是諸多人工智能難題中的一個。參賽者設計程序來解決三個子任務:閱讀每篇論文并確定其關鍵概念,按類型組織關鍵詞,以及識別不同關鍵短語之間的關系。競賽不僅僅是一場學術活動:Augenstein與世界最大的科學出版商之一的Elsevier簽訂了為期兩年的合同,為后者的圖書館開發(fā)計算機工具。
Elsevier出版超過7500種不同期刊。每個期刊的編輯都必須為每份來稿找到合適的審稿人。(2015年,70萬同行評審人員在Elsevier上評審了超過180萬份稿件,其中40萬份最終得到出版。)“能夠評審稿件的人通常僅限于該領域的專家。”數(shù)字地圖公司Descartes的CEO邁克·沃倫(Mike Warren)說。“你將這么一小群擁有博士學位的專家按學科和子學科進行細分,最后,全世界可能只有100人有資格審閱某份來稿。”Augenstein幫助Elsevier使用科技手段為每篇稿件自動尋找合適的審稿人。
Elsevier開發(fā)了一套名為“Evise”的自動化工具來幫助進行同行評審。該程序能夠檢查抄襲(這只是搜索和匹配功能,還談不上AI),為審稿做最基礎的把關。此外還有處理作者、編輯和審稿人之間的工作流程。另外幾家主要的出版商也都有自動化軟件來幫助進行同行評審。Springer-Nature當下正在測試一個名為“StatReviewer”的軟件,確保每份來稿具有完整和準確的統(tǒng)計數(shù)據(jù)。
不過這些同行在能力和愿景上都無法同Elsevier相提并論。“我們正在調查更有抱負的任務,”Augenstein說。“當你對一篇論文有疑問,機器學習模型能夠通讀論文并回答你的問題。”
不過并非所有人都被“機器人博士”的前景所迷惑。上個月,芬蘭赫爾辛基大學環(huán)境政策教授Janne Hukkinen和Elsevier雜志《生態(tài)經(jīng)濟學》的編輯為WIRED撰寫了一篇文章,提醒人們對完全自動的AI同行評審保持警惕:
“通過查詢出版商審閱著資料的數(shù)據(jù)庫,分析過往評審中審稿人和編輯之間的交流,并識別從提交到最終編輯拍板這一整個流程中的變化模式——學習型算法完全可以接管從最初提交到最終決定的整個評審過程。更重要的是,將人工從同行評審之中剔除,能夠減輕力求開放的學者與反對開放的商業(yè)出版商之間的緊張關系。”
按照Hukkinen的邏輯,一個能夠勝任同行評審的AI同樣也可以動筆寫論文。最終,人類將成為科研中的遺留系統(tǒng)——冗余、低效又過時。他最終的觀點是:“不經(jīng)人類產(chǎn)生的新知將會動搖人類文化的基矗”
不過Hukkinen的警惕有點憂慮過早。“盡管AI在象棋、圍棋和撲克這樣的游戲中取得巨大成功,但仍然不能理解大多數(shù)普通的英文句子,更別說科學文本了。”艾倫人工智能研究所(Allen Institute for Artificial Intelligence)首席執(zhí)行官Oren Etzioni說。ScienceIE競賽團隊的實例或可為其提供佐證:最終獲勝的團隊在三個子任務挑戰(zhàn)中只達到43%的分數(shù)。