對于一個成熟的產(chǎn)品來說,隱藏在產(chǎn)品背后的數(shù)據(jù)分析是非常重要的,也是必不可少的。特別是在重視用戶體驗的今天,需要我們及時了解產(chǎn)品的使用情況,分析數(shù)據(jù)中隱藏的信息,為產(chǎn)品的提升和改進提供數(shù)據(jù)支撐。
隨著 web 技術(shù)的蓬勃發(fā)展,前端的展示、交互越來越復雜,在用戶的訪問、操作過程中產(chǎn)生了大量的數(shù)據(jù)。由此,前端的數(shù)據(jù)分析也變得尤為重要。當然,對于站長來說,你可以使用百度統(tǒng)計等各種已有的服務(wù)平臺,但是,如果現(xiàn)有的統(tǒng)計平臺不能滿足你的需要,你想開發(fā)自己定制化的數(shù)據(jù)統(tǒng)計平臺,或者你是一個純粹的 geek,想了解背后隱藏的技術(shù),又或者你對前端的數(shù)據(jù)統(tǒng)計感興趣,本文就能滿足你那顆好奇的心。下面就逐步描述前端有哪些數(shù)據(jù)、如何采集前端的數(shù)據(jù)、以及如何展示數(shù)據(jù)統(tǒng)計的結(jié)果。
有哪些?
前端的數(shù)據(jù)其實有很多,從大眾普遍關(guān)注的 PV、UV、廣告點擊量,到客戶端的網(wǎng)絡(luò)環(huán)境、登陸狀態(tài),再到瀏覽器、操作系統(tǒng)信息,最后到頁面性能、JS 異常,這些數(shù)據(jù)都可以在前端收集到。數(shù)據(jù)很多、很雜,不進行很好的分類肯定會導致統(tǒng)計混亂,也不利于統(tǒng)計代碼的組織,下面就對幾種普遍的數(shù)據(jù)需求進行了分類:
1、訪問
訪問數(shù)據(jù)是基于用戶每次在瀏覽器上打開目標頁面來統(tǒng)計的,它是以 PV 為粒度的統(tǒng)計,一個 PV 只統(tǒng)計一次訪問數(shù)據(jù)。訪問數(shù)據(jù)可以算作是最基礎(chǔ)、覆蓋面最廣的一種統(tǒng)計,可以統(tǒng)計到很多的指標項,下面列出了一些較為常見的指標項:
- PV/UV:最基礎(chǔ)的 PV(頁面訪問數(shù)量)、UV(獨立訪問用戶數(shù)量)
- 頁面來源:頁面的 refer,可以定位頁面的入口
- 操作系統(tǒng):了解用戶的 OS 狀況,幫助分析用戶群體的特征,特別是移動端,iOS 和 Android 的分布就更有意義了
- 瀏覽器:可以統(tǒng)計到各種瀏覽器的占比,對于是否繼續(xù)兼容 IE6、新技術(shù)(HTML5、CSS3 等)的運用等調(diào)研提供參考價值
- 分辨率:對頁面設(shè)計提供參考,特別是響應(yīng)式設(shè)計
- 登錄率:百度也開始看重登陸,登陸用戶具有更高的分析價值,引導用戶登陸是非常重要的
- 地域分布:訪問用戶在地理位置上的分布,可以針對不同地域做運營、活動等
- 網(wǎng)絡(luò)類型:wifi/3G/2G,為產(chǎn)品是否需要適配不同網(wǎng)絡(luò)環(huán)境做決策
- 訪問時段:掌握用戶訪問時間的分布,引導消峰填谷、節(jié)省帶寬
- 停留時長:判斷頁面內(nèi)容是否具有吸引力,對于需要長時間閱讀的頁面比較有意義
- 到達深度:和停留時長類似,例如百度百科,用戶瀏覽時的頁面到達深度直接反映詞條的質(zhì)量
2、性能
頁面 DOM 結(jié)構(gòu)越來越復雜,但是又要追求用戶體驗,這就對頁面的性能提出了更高的要求。性能的監(jiān)控數(shù)據(jù)主要是用來衡量頁面的流暢程度,也有一些主要的指標:
- 白屏時間:用戶從打開頁面開始到頁面開始有東西呈現(xiàn)為止,這過程中占用的時間就是白屏時間
- 首屏時間:用戶瀏覽器首屏內(nèi)所有內(nèi)容都呈現(xiàn)出來所花費的時間
- 用戶可操作時間:用戶可以進行正常的點擊、輸入等操作
- 頁面總下載時間:頁面所有資源都加載完成并呈現(xiàn)出來所花的時間,即頁面 onload 的時間
- 自定義的時間點:對于開發(fā)人員來說,完全可以自定義一些時間點,例如:某個組件 init 完成的時間、某個重要模塊加載的時間等等
這里只是解釋了這些指標的含義,具體的判斷、統(tǒng)計方式在后續(xù)發(fā)出的文章中會詳細介紹。
3、點擊
在用戶的所有操作中,點擊應(yīng)該是最為主要的一個行為,包含了:pc 端鼠標的 click,移動端手指的 touch。用戶的每次點擊都是一次訴求,從點擊數(shù)據(jù)中可以挖掘的信息其實有很多,下面只列出了我們目前所關(guān)注的指標: