無(wú)線音樂(lè)是用戶利用手機(jī)等通信終端,以WAP、WEB、APP等接入方式獲取以音樂(lè)為主題內(nèi)容的相關(guān)業(yè)務(wù)的總稱,具體包括彩鈴、無(wú)線音樂(lè)俱樂(lè)部、及手機(jī)客戶端軟件等業(yè)務(wù)??梢哉f(shuō)在智能手機(jī)時(shí)代,手機(jī)客戶端音樂(lè)逐漸成為用戶享受生活的主要方式。
隨著智能手機(jī)的不斷普及,無(wú)線音樂(lè)行業(yè)成就了一些大頭手機(jī)音樂(lè)客戶端公司,這些公司擁有著上百萬(wàn)甚至千萬(wàn)級(jí)別規(guī)模的用戶群體。
手機(jī)客戶端音樂(lè)的不斷發(fā)展及用戶群體的不斷壯大,隨之也帶來(lái)了大量無(wú)線音樂(lè)數(shù)據(jù)的產(chǎn)生。這些數(shù)據(jù)看似雜亂無(wú)章、繁多冗余,但卻隱藏著很多的秘密。如果能有效地對(duì)這些數(shù)據(jù)進(jìn)行組織管理,并且利用相關(guān)技術(shù)進(jìn)行挖掘、分析,少則可以揭示一個(gè)公司一次決策實(shí)施后的效果,發(fā)現(xiàn)公司現(xiàn)有存在的重大問(wèn)題,多則發(fā)現(xiàn)潛在的高價(jià)值業(yè)務(wù)或需求,這些業(yè)務(wù)或需求很有可能為公司的發(fā)展提供戰(zhàn)略性指導(dǎo)意見。
下面以國(guó)內(nèi)某著名手機(jī)客戶端音樂(lè)公司的無(wú)線音樂(lè)數(shù)據(jù)為例,我們還是按照發(fā)現(xiàn)問(wèn)題、解決問(wèn)題、結(jié)果驗(yàn)證這三個(gè)方面來(lái)說(shuō)明無(wú)線音樂(lè)數(shù)據(jù)的組織與應(yīng)用。
發(fā)現(xiàn)問(wèn)題
通過(guò)對(duì)該數(shù)據(jù)進(jìn)行分析挖掘,我們發(fā)現(xiàn)如下幾個(gè)問(wèn)題。
(1) 用戶、歌曲均存在長(zhǎng)尾效應(yīng)
從數(shù)據(jù)中我們發(fā)現(xiàn)用戶有兩種行為,一種是下載、一種是試聽,
每種行為中,我們發(fā)現(xiàn)用戶和歌曲均存在“長(zhǎng)尾現(xiàn)象”,絕大部分用戶只試聽或下載系統(tǒng)中的少部分歌曲,而大部分歌曲出于閑置狀態(tài)。具體信息如下圖
音樂(lè)的長(zhǎng)尾問(wèn)題
說(shuō)明:圖中左子圖橫坐標(biāo)表示用戶的聽歌,縱坐標(biāo)表示對(duì)應(yīng)用戶所占比例。右子圖橫坐標(biāo)表示歌曲的被多少人聽過(guò),縱坐標(biāo)表示對(duì)應(yīng)度歌曲所占比例。造成這方面的原因可能是:數(shù)據(jù)量大,信息過(guò)載嚴(yán)重用戶找不到自己喜歡的歌曲。
此時(shí)大多數(shù)用戶直接轉(zhuǎn)向流行榜或熱歌榜歌曲,就會(huì)造成系統(tǒng)中熱門歌曲越熱門,冷門歌曲越冷門的現(xiàn)象。
(2) 歌曲覆蓋率低
從數(shù)據(jù)中我們還發(fā)現(xiàn)歌曲的覆蓋率很低,在整個(gè)抽樣數(shù)據(jù)中歌曲
覆蓋率只有2.01%。絕大部門歌曲根本沒(méi)有被用戶聽過(guò)或者下載過(guò),這不僅造成系統(tǒng)資源的大量浪費(fèi),而且造成公司資金的無(wú)辜流失(因?yàn)槊渴赘枨家栋鏅?quán)費(fèi),而系統(tǒng)中98%的歌曲處于浪費(fèi)狀態(tài))。歌曲的覆蓋率累計(jì)分布如下如圖。
歌曲覆蓋率圖
說(shuō)明:圖中橫坐標(biāo)表示歌曲的被聽歌人數(shù)(去重),縱坐標(biāo)是不小于這個(gè)數(shù)目的歌曲所占的比例。
造成這方面的原因可能是:大量歌曲處于冷啟動(dòng)狀態(tài),數(shù)據(jù)稀疏。作為冷啟動(dòng)作曲,系統(tǒng)不知道如何把他推送到適當(dāng)?shù)挠脩羰掷?,而用戶也不能通過(guò)有效方式找到他,就使得這類歌曲處理系統(tǒng)的暗處,不容易被發(fā)現(xiàn)。
(3) 用戶每天聽歌時(shí)間呈間斷性分布
在給定的樣本數(shù)據(jù)中,我們發(fā)現(xiàn)用戶聽歌行為并不是均勻分布,而是間斷性分布,即在不同的時(shí)間用戶聽歌集中度不同。為了更好的看出效果,我們將一天分為8個(gè)時(shí)間段,每個(gè)時(shí)間段包括3個(gè)小時(shí),在每個(gè)時(shí)間段內(nèi)用戶聽歌活躍性如下圖。
用戶活躍時(shí)間圖
說(shuō)明:圖中橫坐標(biāo)表示時(shí)間段,縱坐標(biāo)是該時(shí)間段內(nèi)用戶的活躍性比。
造成這方面的原因可能是: 下班、休息、乏困疲憊時(shí)間
用戶在無(wú)限端聽歌的模式還是傾向于休閑與娛樂(lè),主要是以休息碎片時(shí)間為主。
(4) 不同用戶對(duì)歌曲的屬性依賴性不同
在樣本數(shù)據(jù)中,歌曲有專輯與歌手兩種屬性。我們從用戶的長(zhǎng)程關(guān)聯(lián)顯著性、短程關(guān)聯(lián)顯著性等方面對(duì)用戶的聽歌行為進(jìn)行分析,分析具體結(jié)果如下表:
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):