
說(shuō)明:圖中Strong null model、Weak null mode、Temporal null model分別表示系統(tǒng)中所有播放之間相似度值,所有歌曲之間的相似性值,相鄰播放之間相似性值。Album表示專輯,Artist表示歌手。造成這方面的原因可能是: 與專輯相比用戶傾向于聽(tīng)同一個(gè)歌手的歌曲
(5) 不同用戶聽(tīng)歌行為不同
從數(shù)據(jù)中我們分析還得出,不同活躍性的用戶所聽(tīng)歌曲也不同。分析中我們從歌曲新穎性、歌曲在專輯上的相似性、歌曲在歌手上的相似性三個(gè)指標(biāo)上對(duì)不同活躍性的用戶所聽(tīng)歌曲進(jìn)行分析。
具體信息如下圖
歌曲的三個(gè)維度分析
說(shuō)明:圖中橫坐標(biāo)表示用戶的活躍性值,縱坐標(biāo)表示對(duì)應(yīng)活躍性用戶所聽(tīng)歌曲的新穎性值、歌曲在專輯上的相似性值、歌曲在歌手上的相似性值
造成這方面的原因可能是: 用戶可能呈分群現(xiàn)象
活躍性較低的用戶可能是普通用戶,這類用戶根據(jù)自己的愛(ài)好來(lái)選擇自己想聽(tīng)的歌曲?;钴S性較高的用戶可能是專業(yè)用戶,這類用戶根據(jù)自己的專業(yè)需要來(lái)選擇自己想聽(tīng)的歌曲。
解決方案
從上面一小節(jié)的討論中,我們已經(jīng)知道無(wú)線音樂(lè)端大數(shù)據(jù)中可能隱藏的幾個(gè)問(wèn)題如下:
①用戶、歌曲均存在長(zhǎng)尾效應(yīng)
②歌曲覆蓋率低
③用戶每天聽(tīng)歌時(shí)間呈間斷性分布
④不同用戶對(duì)歌曲的屬性依賴性不同
⑤不同用戶聽(tīng)歌行為不同
當(dāng)一個(gè)公司面對(duì)以上問(wèn)題時(shí)應(yīng)該采用怎樣的解決方案來(lái)解決或者
改善當(dāng)前情況是另一個(gè)重要的問(wèn)題。尤其是上述問(wèn)題①、②,如果處理不恰當(dāng),可能會(huì)影響整個(gè)公司是否能正常運(yùn)行,甚至影響公司的發(fā)展。
因此,本部分從無(wú)線音樂(lè)數(shù)據(jù)出發(fā),提出幾種適合的解決方案。
(1)用戶、歌曲均存在長(zhǎng)尾效應(yīng),我們可以采用以下技術(shù)
采用信息過(guò)濾技術(shù),一種方法可以對(duì)歌曲進(jìn)行分類,將不同的用戶映射到不同的歌曲類別中。另一種方法就是個(gè)性化推薦技術(shù),系統(tǒng)自動(dòng)的分析用戶的偏好為不同用戶過(guò)濾相應(yīng)的歌曲。
(2)歌曲覆蓋率低,我們可以采用如下技術(shù)
歌曲覆蓋率低主要是因?yàn)橛脩粽业讲坏揭魳?lè),造成這個(gè)問(wèn)題的原因主要有兩種:①音樂(lè)本身的信息不充足,②音樂(lè)有信息,但是用戶找不到這些音樂(lè)。
所以一方面我們可以給音樂(lè)打標(biāo)簽,使用標(biāo)簽信息來(lái)表示歌曲的具體屬性;另一方面,我們可以采用推薦技術(shù)對(duì)歌曲進(jìn)行個(gè)性化推薦。
(3)用戶每天聽(tīng)歌時(shí)間呈間斷性分布,我們可以采用如下技術(shù)
在不同的時(shí)間,我們?cè)O(shè)置不同的主題歌曲以適應(yīng)不同的聽(tīng)歌場(chǎng)景,比如夜晚放舒緩、平滑的歌曲,上午上搖滾、重金屬之類的歌曲。
當(dāng)然具體的場(chǎng)景還需要通過(guò)進(jìn)一步的數(shù)據(jù)挖掘來(lái)獲得,本文只是提出一種方法,對(duì)具體技術(shù)不做過(guò)多闡述。
(4)不同用戶對(duì)歌曲的屬性依賴性不同,我們采用如下技術(shù)
通過(guò)歷史數(shù)據(jù)分析獲取用戶對(duì)歌曲屬性的依賴性,從中我們能得知用戶對(duì)哪種屬性更加依賴。當(dāng)發(fā)現(xiàn)用戶對(duì)流派更依賴,則我們可以根據(jù)流派為其播放歌曲,當(dāng)發(fā)現(xiàn)用戶對(duì)歌手感興趣,則我可以根據(jù)歌手為其播放歌曲。
(5)不同用戶聽(tīng)歌行為不同,我們可以采用如下技術(shù)
根據(jù)用戶特征將用戶分群,這樣可以將用戶分為多個(gè)不同的群體。針對(duì)不同的群體我們給其播放的歌曲不同,比如普通用戶可以熱歌為主進(jìn)行播放,而對(duì)于專業(yè)歌手,我們則以高多樣的歌曲來(lái)為其播放。
結(jié)果驗(yàn)證
為了進(jìn)一步說(shuō)明上述解決方案的有效性,此處我們僅采用推薦算法來(lái)進(jìn)行說(shuō)明當(dāng)系統(tǒng)采用該解決方案后,系統(tǒng)中出現(xiàn)的一些顯著變化,具體的變化如下:
l 用戶更容易找到自己喜歡的歌曲
用戶找更容易找到歌曲
該音樂(lè)網(wǎng)站目前采用熱歌榜(GRM)來(lái)組織歌曲,通過(guò)此種方式用戶找到其喜歡歌曲的概率是千分之一左右,當(dāng)我們采用了3種推薦方法(分別是OCF、HC、MD)后,發(fā)現(xiàn)用戶找到自己喜歡歌曲的概率明顯增加,而且對(duì)于MD算法,其準(zhǔn)確度提升了10倍之多。
2/3 首頁(yè) 上一頁(yè) 1 2 3 下一頁(yè) 尾頁(yè)
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):