除了以上幾個重要模塊的展示外,社會焦點透視鏡系統(tǒng)還有其他一些豐富的展示效果,詳情請見http://qx.8wss.com。
3 社會焦點透視鏡系統(tǒng)的應(yīng)用實例——“9·3閱兵”
與人民網(wǎng)和新浪微博合作,筆者將社會焦點透視鏡系統(tǒng)的關(guān)鍵技術(shù)用于了2015年的“9·3閱兵”話題中,推出了閱兵大數(shù)據(jù)“網(wǎng)民情緒展示”平臺,該平臺每隔15 min刷新一次數(shù)據(jù),進(jìn)行展示。
“網(wǎng)民情緒展示”平臺的主要功能包括:網(wǎng)民實時關(guān)注熱門地區(qū)排名、網(wǎng)民實時評論閱兵熱點高頻詞分析、網(wǎng)民實時熱點話題排行榜以及整個閱兵過程中的輿情走勢等。該平臺共采集了9月3日8:30-12:30這4 h內(nèi)網(wǎng)民在新浪微博平臺上的閱兵相關(guān)話題,并進(jìn)行分析統(tǒng)計。大數(shù)據(jù)分析結(jié)果顯示:原創(chuàng)微博及轉(zhuǎn)發(fā)微博總帖量共計453萬人次,網(wǎng)民參與發(fā)帖的峰值點出現(xiàn)在中午12:00,峰值數(shù)據(jù)為50萬人次;熱門地區(qū)被廣東、北京和山東包攬前三甲;網(wǎng)民熱議的高頻詞有“國泰民安、挺身而出、舍生忘死”等;“習(xí)近平宣布將裁軍30萬”成為網(wǎng)民最熱議的話題。
圖5是“網(wǎng)民情緒展示”平臺的部分?jǐn)?shù)據(jù)截圖。
圖 5 “網(wǎng)民情緒展示”平臺的部分?jǐn)?shù)據(jù)截圖
4 結(jié)束語
本文介紹的“社會焦點透視鏡系統(tǒng)”是微博大數(shù)據(jù)時代下的一種新型的輿情監(jiān)測平臺。該系統(tǒng)不僅可以像傳統(tǒng)系統(tǒng)一樣展示出社會熱議的事情及民眾的情緒分析,還可以深層透視焦點事件背后情緒分布的原因及其相應(yīng)的用戶群體,相信可以對當(dāng)代社會治理方案的制定提供一定的技術(shù)支持。
作者簡介:
趙妍妍(1983-),女,哈爾濱工業(yè)大學(xué)機(jī)電學(xué)院媒體技術(shù)與藝術(shù)系副教授、碩士生導(dǎo)師,中國中文信息學(xué)會社會媒體處理專委會委員,主要研究方向為社會計算、情感分析。
秦兵(1968-),女,哈爾濱工業(yè)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院教授、博士生導(dǎo)師,社會計算與信息檢索中心副主任,中文信息學(xué)會信息檢索專委會委員,中國計算機(jī)學(xué)會中文信息技術(shù)委員會委員,主要研究方向為社會計算、自然語言處理、文本挖掘。
劉挺(1972-),男,哈爾濱工業(yè)大學(xué)教授,社會計算與信息檢索研究中心主任,中國計算機(jī)學(xué)會理事,中國中文信息學(xué)會常務(wù)理事、社會媒體處理專業(yè)委員會主任,國際會議ACL2014、EMNLP2015領(lǐng)域主席,主要研究方向為社會計算、信息檢索和自然語言處理。
參考文獻(xiàn):
[1] ZHAO J C, DONG L, WU J J, et al. MoodLens: an emoticon-based sentiment analysis system for Chinese Tweets in Weibo[C]//The 18th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, August 12-16, 2012, Beijing, China. New York: ACM Press, 2012: 1528-1531.
[2] WANG H, CAN D, KAZEMZADEH A, et al. A system for real-time Twitter sentiment analysis of 2012 U.S. presidential election cycle[C]//The ACL 2012 System Demonstrations, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 115-120.
[3] CIOT M, SONDEREGGER M, RUTHS D. Gender inference of Twitter users in non-English contexts[C]//The 2013 Conference on Empirical Methods in Natural Language Processing, October 18-21, 2013, Seattle, Washington, USA. Sofia: Association for Computational Linguistics, 2013: 1136-1145.
[4] DIAO Q M, JIANG J, ZHU F D, et al. Finding bursty topics from microblogs[C]//The 50th Annual Meeting of the Association for Computational Linguistics, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 536-544.
[5] WILLIAMS J, KATZ G. Extracting and modeling durations for habits and events from Twitter[C]//The 50th Annual Meeting of the Association for Computational Linguistics, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 223-227.
[6] ZHAO Y Y, QIN B, LIU T, et al. Social sentiment sensor: a visualization system for topic detection and topic sentiment analysis on Microblog[J]. Multimedia Tools and Applications, 2014: 1-18.
[7] MOHAMMAD S M, KIRITCHENKO S, ZHU X D. NRC-Canada: building the state-of-the-art in sentiment analysis of Tweets[C]//The International Workshop on Semantic Evaluation, June 2013, Atlanta, USA. New York: Association for Computational Linguistics, 2013: 321-327.
[8] SOCHER R, PERELYGIN A, Wu J, et al. Recursive deep models for semantic compositionality over a sentiment treebank[C]//The Conference on Empirical Methods in Natural Language Processing(EMNLP 2013), October 18-21, 2013, Seattle, WA, USA. Sofia: Association for Computational Linguistics, 2013: 1631-1642.