從技術(shù)的角度來看,擅長(zhǎng)講故事的迪士尼在這方面也有相當(dāng)多的積累,例如隱藏在上海迪士尼樂園里的那些。現(xiàn)在,迪士尼也要做AI研究,想幫助視頻剪輯師更好地工作。
迪士尼旗下的迪士尼研究部門(Disney Research)和蘇黎世聯(lián)邦理工學(xué)院合作,正在開發(fā)一套機(jī)器學(xué)習(xí)系統(tǒng),在識(shí)別畫面的基礎(chǔ)上,將畫面跟相關(guān)的聲音連接起來。
這聽起來可能有點(diǎn)繞,其實(shí)是日常生活常見的現(xiàn)象。例如隨著關(guān)門的動(dòng)作進(jìn)行,人們會(huì)“想象”特定的關(guān)門聲音。本質(zhì)上,其實(shí)是人們把關(guān)門相關(guān)的視覺信息跟聲音信息做了連接。
這項(xiàng)研究想要做的,就是培養(yǎng)機(jī)器人這種關(guān)聯(lián)性。在建立畫面和聲音的強(qiáng)關(guān)聯(lián)性上,最大的障礙是那些跟畫面中的物體運(yùn)動(dòng)不相關(guān)的聲音,例如汽車開在馬路上,附近還有公放的音樂,這會(huì)形成干擾。
他們的培訓(xùn)方式是這樣的,給機(jī)器人喂入一系列隨手拍攝的、帶有聲音的視頻。在喂入前,他們做了前期加工,從視頻畫面中用軟件篩掉那些含有較低雜音,或者純背景音的畫面,再把剩下的畫面、聲音喂入到系統(tǒng)內(nèi),對(duì)它進(jìn)行培訓(xùn)。
在歐洲機(jī)器學(xué)習(xí)大會(huì)上,這些研究員展示了初步的研究結(jié)果,他們培訓(xùn)的AI系統(tǒng)成功地做了這些畫面跟聲音的配對(duì):關(guān)門、杯子碰撞和汽車在馬路上行駛。
暫時(shí)還不清楚這個(gè)研究會(huì)如何幫助迪士尼。在研究報(bào)告中,這些研究員稱,他們的技術(shù)除了有助于幫視頻畫面跟聲音做匹配,可能還有助于對(duì)視頻資料的分類,或者是運(yùn)動(dòng)識(shí)別。這些聽上去可能是幫助剪輯師在后期剪輯時(shí)提高效率。
作為一個(gè)支援部門,迪士尼研究部門做的研究看上去跟其它科技公司沒有太大差別,但開發(fā)的主要目的是為了能應(yīng)用于迪士尼的旗下業(yè)務(wù)。
去年,這個(gè)研究部門還推出了一項(xiàng)新的眼球追蹤技術(shù),幾乎可以復(fù)制人眼。他們使用了大量攝像頭和燈光來捕捉人眼的所有細(xì)節(jié),還能保證復(fù)制品能根據(jù)環(huán)境變化而發(fā)生改變。
題圖來自;維基百科
登陸|注冊(cè)歡迎登陸本站,認(rèn)識(shí)更多朋友,獲得更多精彩內(nèi)容推薦!