大數(shù)據(jù)在傳媒業(yè)的另一個應用領域是網絡輿情分析,跟營銷關系也很密切。網絡輿情怎么測量,跟網下輿情有什么關系?明星范瑋琪在新浪微博上“曬娃”被罵,但為什么是范瑋琪?她沒有王菲有名,粉絲也沒有小S多,發(fā)個照片怎么就能引起軒然大波?因為新浪有一個數(shù)據(jù)算法,算了以后范瑋琪在那個時段被置頂?shù)綗狳c排行榜,越來越多的人點擊到她的頁面去看,結果比大閱兵點擊率還高,就被部分網民罵了。在這件事中,是服務器影響和改變了輿論?,F(xiàn)在的網絡輿情是怎樣生成的值得關注,我們逐漸從中看到了數(shù)據(jù)的力量。
以前,我們打100多次電話做一個輿情的調查,很累,現(xiàn)在都是通過大數(shù)據(jù)來分析。中國人的情緒在微博上是什么反映?基本上,過年的時候高一些,年底放假很高興,過年的時候興,地震的時候低一些,每年的趨勢大體差不多,有一些特殊時點有些變化。
從新聞傳播角度講,一方面要理解和學習數(shù)據(jù)的結構,運用大數(shù)據(jù)服務新聞、輿情分析、后臺分析、計算廣告和營銷效果評估等;另一方面應該思考怎樣有限度地使用數(shù)據(jù)的價值。比如,計算新聞學應用場景數(shù)據(jù)、輿情分析等提高信息和新聞傳播效果,日益得到重視。但大數(shù)據(jù)的發(fā)展還有很多挑戰(zhàn),數(shù)據(jù)非常多,但不一定完整,不一定準確,背后需要發(fā)掘的東西太多,應該告別大數(shù)據(jù)泡沫,走向真正的數(shù)據(jù)科學研究。
傳媒業(yè)的數(shù)據(jù)已成為社會大數(shù)據(jù)的重要來源,也是影響市場和管理的重要因素,很大程度上影響到營銷、消費、決策?,F(xiàn)在,媒體消費行為與商品消費行為是無縫銜接的,媒體大數(shù)據(jù)的挖掘跟市場營銷管理決策緊密關聯(lián)在一起——消費由消費者接觸媒體后產生,并通過媒體實現(xiàn),消費后會把評論和感受反饋到媒體上。
信息的傳播者還會通過搜集相關數(shù)據(jù),精準定向廣告的受眾,測量廣告擴散的廣度和深度,測算廣告對品牌認知、購買行為的影響,用大數(shù)據(jù)分析電子商務與廣告的效果、消費者口碑傳播的心理和行為、評論的文本、傳播效果等。
找到好問題,體現(xiàn)數(shù)據(jù)的價值
很多人拿到數(shù)據(jù)特別高興,我現(xiàn)在不這樣了,數(shù)據(jù)都好不到哪兒去,拿到數(shù)據(jù)只是第一步,找到一個特別好的研究問題才是關鍵。我覺得如果用中國數(shù)據(jù),用這些數(shù)據(jù)去測試一些特別大的問題,這才能體現(xiàn)數(shù)據(jù)的價值。
做研究有兩類,一類是做理論的,他們只寫公式,文章里沒有數(shù)據(jù);我是做實證的,拿數(shù)據(jù)驗證他們的理論,我辦公室有三四臺戴爾并行服務器,一臺一萬美元,但我的技術還是比不上今天真正研究大數(shù)據(jù)的,他們都是既懂統(tǒng)計又懂計算機的人。
很多年前,我在國外做研究時,基本上用的都是中國的數(shù)據(jù),有一些電商的數(shù)據(jù),比如淘寶的,有家電下鄉(xiāng)項目的數(shù)據(jù),還有網游的數(shù)據(jù)。從幾年前開始,學術研究中中國的數(shù)據(jù)越來越多,我就思考,這些數(shù)據(jù)有沒有問題,比如,中國的數(shù)據(jù)有什么獨特之處?有代表性嗎?研究結果能不能在全世界通用?這些數(shù)據(jù)可靠嗎?
為什么要用中國的數(shù)據(jù),我個人的經驗總結,主要是三點原因,第一,美國等國也有類似的數(shù)據(jù),但拿不到。我是百度營銷研究院的顧問,除了核心數(shù)據(jù)基本都可以接觸到。第二,研究涉及中國或者新興市場特有的問題,用中國的數(shù)據(jù)順理成章。第三,這個問題在中國和國外都有,但在國外驗證起來更加困難,或者可能沒有條件去驗證,但在中國,驗證起來特別順利。
我做過一些經濟現(xiàn)象的實證研究,在此講一下背后的大數(shù)據(jù)情況。
首先,第一個問題是extortion(敲詐勒索),很多文章和理論都認為敲詐勒索會影響市場效率,但實證研究很難做?,F(xiàn)在線上電商平臺越做越大,線上顧客打分、評語很重要,評語會影響其他顧客的購買行為,商家受此影響會改變行為。有些不太好的顧客看到這個機會,就會利用寫評論敲詐勒索,寫差評要挾店家。
2012年到2013年的時候,差評師很猖狂,我們從淘寶拿到了這方面的數(shù)據(jù)。當時淘寶派人打入這些差評師的機構,潛入他們的聊天室,分析他們的行為,拿出好幾份不同的報告,內容有重合也有不同,這些數(shù)據(jù)不是特別清晰,也有一些誤差。
我們根據(jù)這些數(shù)據(jù),到差評師買過、評過的女裝商品下,分析差評師的留言和行為。第一,我們研究這些差評師選商家時有沒有規(guī)則,是用一套專門的體系化方式選人,還是隨機的?第二,差評師這么做之后,對商家的影響是什么,商家的行為會怎么改變?第三,這種行為導致的經濟損失有多少,近期、長期損失是什么?