11月12日消息,據(jù)國外媒體報道,也許你今天還在為應(yīng)該聽什么歌而發(fā)愁,但是不久的將來互聯(lián)網(wǎng)音樂工業(yè)將采用更先進的方式來為你解決這個問題。谷歌、百度和Spotify還沒有完全向外界展示該方法的全貌,但他們都努力在用一種叫做“深度學(xué)習(xí)(deep learning)”的人工智能系統(tǒng)為用戶提供更好的音樂播放列表。
“深度學(xué)習(xí)”是人工智能的的一個培訓(xùn)系統(tǒng)分支,稱為“人工神經(jīng)網(wǎng)絡(luò)”。目前,所有這些公司都聘請了“深度學(xué)習(xí)”專家。包括谷歌、百度在內(nèi)的公司把“深度學(xué)習(xí)”工具用于各種目的-廣告、語音識別、圖像識別甚至是數(shù)據(jù)中心優(yōu)化。有一家創(chuàng)業(yè)公司甚至打算用“深度學(xué)習(xí)”識別醫(yī)學(xué)圖像的模式。
現(xiàn)在,這些公司正在轉(zhuǎn)向音樂工業(yè)?;谝魳妨髅襟w服務(wù)的神經(jīng)網(wǎng)絡(luò),無需音樂家的指點,就可以識別音樂的和弦模式。然后推薦符合用戶喜好的歌曲、專輯或藝術(shù)家。把這些復(fù)雜的系統(tǒng)投入實際應(yīng)用不是一朝一夕的事情。但是,一旦該技術(shù)變得成熟,“深度學(xué)習(xí)”可能讓用戶未來對于音樂流媒體服務(wù)無法割舍。
音樂流媒體神經(jīng)網(wǎng)絡(luò)起源
人們開始關(guān)注音樂流媒體神經(jīng)網(wǎng)絡(luò)起源于比利時根特大學(xué)去年的學(xué)術(shù)論文。該大學(xué)的電子和信息系統(tǒng)部門發(fā)表了名為《存續(xù)計算》的論文。該論文說明了使用卷積神經(jīng)網(wǎng)絡(luò)(細胞神經(jīng)網(wǎng)絡(luò))選擇歌曲屬性的方法。而不是像工程師以前那樣利用神經(jīng)網(wǎng)絡(luò)來觀察圖像的特征。
該論文發(fā)現(xiàn),他們的方法可以“產(chǎn)生合理的建議”。更重要的是,他們的實驗表明,該系統(tǒng)“顯著優(yōu)于傳統(tǒng)的做法”。微軟的研究人員最近甚至引用該論文作為“深度學(xué)習(xí)”領(lǐng)域的概述。該論文也引起了Spotify的注意。論文作者Dieleman表示,“他們邀請我們?nèi)potify的辦公室談了談相關(guān)內(nèi)容,我想我們的論文是非常有幫助的。”
業(yè)界廣為接受
“深度學(xué)習(xí)”首先從Spotify的系統(tǒng)中脫穎而出。目前,Spotify采用較為傳統(tǒng)的數(shù)據(jù)分析方法,對特定的音樂在互聯(lián)網(wǎng)上的文本內(nèi)容進行分析,以及對歌曲本身進行聲學(xué)分析。聲學(xué)分析基于歌曲的某些特質(zhì),比如節(jié)奏、音量和按鍵。該系統(tǒng)需要大量特定領(lǐng)域的信息輸入。但比利時人所創(chuàng)造的“深度學(xué)習(xí)”方法,則完全不同。
“深度學(xué)習(xí)”分析的是聲音波形,并假定我們不知道歌曲的內(nèi)容。然后機器就可以自動分析出一切結(jié)果。它是一個非常通用的模型,有很大的潛力。該系統(tǒng)沒有采樣Spotify的數(shù)據(jù),只是根據(jù)歌曲的相似性提供播放列表。目前該系統(tǒng)并不是Spotify所使用的選歌方法的完美替代。但該公司認為這是值得進一步研究的東西。
同時,“深度學(xué)習(xí)”已經(jīng)在谷歌派上了各種各樣的用場,并且其員工肯定正在調(diào)查該理論在音樂流媒體方面的應(yīng)用可能。谷歌一名專注于音樂技術(shù)的科學(xué)家道格·埃克認為,“令人激動的‘深度學(xué)習(xí)’代表了一個完整的革命,絕對的革命。”
不過麻煩的是,“深度學(xué)習(xí)”可能在檢測歌曲相似性方面做的很好,但優(yōu)化選擇結(jié)果可能意味著多種數(shù)據(jù)的檢測,這并不容易。所以“深度學(xué)習(xí)”可能并不是一個音樂分析軟件的簡易替換。它可能是另一種工具,也許不僅可以用于確定播放列表,它的潛力不止這些。道格·埃克表示“我所看到的是,‘深度學(xué)習(xí)’使我們能夠更好地理解音樂,使我們能夠真正更好地了解音樂是什么。谷歌可以利用它打造更好的產(chǎn)品,一個更好的流媒體服務(wù)。”
未來無限可能
最重要的是,“深度學(xué)習(xí)”可能幫助人們發(fā)現(xiàn)新的音樂。這些音樂可能目前不受歡迎,但用戶聽過之后卻可能會喜歡。但從根本上說,對于那些介紹給聽眾新音樂的分析系統(tǒng),未來仍然是一個挑戰(zhàn)。很多流媒體播放服務(wù)雖然已經(jīng)積累了豐富的音樂數(shù)據(jù)。但不幸的是,總是有新的音樂,因此流媒體音樂服務(wù)還是要一種通用的分析方法。
另外,“深度學(xué)習(xí)”不只是為音樂愛好者準(zhǔn)備。對于藝術(shù)家,“深度學(xué)習(xí)”也可以幫助他們。不基于銷量名氣,而只關(guān)心音樂本身的分析方法,可以更好的幫助那些獨立音樂人以及新人歌手及時的被聽眾發(fā)現(xiàn)。