充斥著被動句式的科學論文晦澀至極,即便是在人腦看來也很難理解。所描述的對象經(jīng)常隱身于層層前述之后,被動句式在日常語言面前顯得深奧難懂。語言學家將任何人類所寫的東西稱為“自然語言”,而自然語言在計算機科學家看來實在是一團亂麻。
“自然語言給AI帶來的一大難題是其模糊性”紐約大學計算機科學家Ernest Davis說。斯坦福大學名譽計算機科學家Terry Winograd有一個經(jīng)典的歧義例子:
市議會拒絕給示威者許可,因為他們(擔心/主張)暴力。
(The city councilmen refused the demonstrators a permit because they [feared/advocated] violence.)
這句子你我都能看明白,動詞“擔心”暗示了“他們”指的是“市議會”而非示威者。我們輕而易舉地明白:示威者“主張”暴力;市議會“擔心”暴力。但是一個計算機大腦可是會在此花費經(jīng)年累月的時間最終也還是搞不清楚到底哪個動詞指向哪個代詞。這種類型的歧義只是自然語言纏結的一個縮影,同形異義詞和敘事邏輯將讓AI更加困擾。
這還沒涉及科學論文中的具體問題,比如將文本論點同數(shù)據(jù)模式進行連接等。即便在純數(shù)學論文中這一需求也很常見。“從英語到數(shù)學中的形式邏輯不是我們可以自動化的。”Davis說。“這是最簡單的工作之一。它是高度限制性的,而我們理解目標。”心理學等同數(shù)學比較遠的學科更是如此。”在心理學論文中,我們幾乎無法檢查其論證的合理性。”Davis說。“我們不知道如何以計算機的方式來表達一個實驗。”
當然,一個完全自動的AI同行評審不僅需要對人類有所了解,還必須對其進行深入思考。“當你考慮AI問題時,同行評審可能是最難的一部分。因為同行評審最重要的職責是確保研究是新穎的,沒有重復前人老路。”沃倫說。計算機程序能夠查閱文獻,找出那些問題仍然懸而未決。但是它卻可能無力辨認出顛覆性的科學新發(fā)現(xiàn)。
俄勒岡州立大學AI研究員Tom Dietterich說:“也許我么只是需要改變我們做科學出版的方式。不是將我們的研究用英語寫成一個故事,而是將我們的意見和論據(jù)鏈接到一個正式化的結構中。比如一個涵蓋人類在某主題下所有知識的數(shù)據(jù)庫。”換句話說,將同行評審的程序電腦化,而不是其解決方案。在這一點上,人們所要重新編程的不是計算機,而是人類行為。
登陸|注冊歡迎登陸本站,認識更多朋友,獲得更多精彩內容推薦!