
騰訊科技訊(樂天)6月11日消息,百度今日宣布,就上周ImageNet國際計算機(jī)視覺挑戰(zhàn)賽違規(guī)行為展開了詳細(xì)調(diào)查?;谡{(diào)查掌握的事實,百度在其美研官方科技博客上發(fā)布公開信,宣布解除當(dāng)事五人參賽小組一名負(fù)責(zé)人的勞動合同,并再次重申百度對科研違規(guī)行為的“零容忍”態(tài)度。
百度在公開信中強(qiáng)調(diào):“任何違背了學(xué)術(shù)誠信和科研誠信的行為,不管大小,都是完全不能被接受的。這類行為和公司文化背道而馳,我們對此類行為采取零容忍的態(tài)度。”
百度還表示,經(jīng)調(diào)查,此次參賽的異構(gòu)計算團(tuán)隊,其工作和百度其他專門進(jìn)行圖像識別研究工作的團(tuán)隊沒有任何聯(lián)系。為更好貫徹公司的科研態(tài)度和原則,百度將進(jìn)一步加強(qiáng)內(nèi)部員工相關(guān)培訓(xùn),并組建一支科研指導(dǎo)小組,為年輕的工程師們提供指導(dǎo)。
今年5月,百度宣稱其在ImageNet測試中取得了全球最好結(jié)果,其圖像識別錯誤率僅為4.58%,而微軟是4.94%,谷歌(微博)為4.8%。在這種測試中,人類辨識ImageNet照片的錯誤率為5%左右。
不過,ImageNet的計算機(jī)科學(xué)家發(fā)表聲明指出,百度在測試中存在違規(guī)行為,百度采用了密集測試的方法以提高成績。按照規(guī)定,ImageNet只允許參與者每周向測試服務(wù)器提交2次測試結(jié)果。可是在3月份的5天時間內(nèi),百度卻提交了40次結(jié)果。ImageNet表示,百度還使用30個不同的賬號,在過去6個月中提交了約200次測試結(jié)果。
在ImageNet測試中,人工智能需要掃描擁有100多萬張圖片的數(shù)據(jù)庫,然后將它們分為1000個不同類別。大多數(shù)研究人員通常使用數(shù)據(jù)庫中的部分圖片,對軟件進(jìn)行圖像識別測試。而通過密集測試,百度工程師可以通過調(diào)整他們的軟件熟悉這些圖片的信息,從而獲得優(yōu)勢。
人工智能公司Clarifai首席執(zhí)行官、ImageNet競賽上屆贏家馬休·澤勒爾(Matthew Zeiler)表示:“這種做法是非常糟糕的,這也是為何要限制參賽者向獨立服務(wù)器提交測試結(jié)果的原因。如果你知道了測試內(nèi)容,你就可以調(diào)整參數(shù)模型,從而獲得更好的測試結(jié)果。”