騰訊微博產(chǎn)品總監(jiān)高自光講解大數(shù)據(jù)在騰訊微博中的應(yīng)用
5月22日消息,騰訊微博團(tuán)隊(duì)近日向媒體展示新版微博功能更新,并解讀大數(shù)據(jù)在微博中的首次應(yīng)用。騰訊微博產(chǎn)品總監(jiān)高自光表示,只有數(shù)據(jù)挖掘精準(zhǔn)度在85%以上才具備進(jìn)行產(chǎn)品化數(shù)據(jù)挖掘的條件。
今年是騰訊微博產(chǎn)品發(fā)布三周年,微博團(tuán)隊(duì)在新版本中進(jìn)行了系統(tǒng)型功能更新,加入了微圈、微熱點(diǎn)、微頻道、微博管家等四項(xiàng)功能,從上個(gè)月開(kāi)始逐步升級(jí)試用。在近日舉辦的騰訊網(wǎng)媒薈上,新版騰訊微博主創(chuàng)團(tuán)隊(duì)首次亮相,對(duì)新功能及背后的技術(shù)開(kāi)發(fā)進(jìn)行了解讀。
微博在為普通網(wǎng)友提供信息發(fā)布平臺(tái)的同時(shí),也帶來(lái)一個(gè)不可避免的桎梏,即信息的過(guò)于龐雜,獲取有效信息的成本大幅增高。如何重組并再傳播微博信息,提高獲取信息的效率,是騰訊微博此次改版的出發(fā)點(diǎn)。
騰訊微博產(chǎn)品總監(jiān)高自光表示,新版微博運(yùn)用了大數(shù)據(jù)挖掘及分析技術(shù),目的就是解決眼下微博產(chǎn)品廣泛存在的“信息碎片化”、“信息過(guò)載”、“垃圾內(nèi)容影響價(jià)值信息獲取”等問(wèn)題。
高自光強(qiáng)調(diào),只有數(shù)據(jù)挖掘精準(zhǔn)度在85%以上時(shí),才具備實(shí)現(xiàn)進(jìn)行產(chǎn)品化數(shù)據(jù)挖掘的條件。基于產(chǎn)品化的數(shù)據(jù)挖掘精準(zhǔn)度不夠,不可能成功。沒(méi)有足夠海量、精準(zhǔn)和實(shí)時(shí)的數(shù)據(jù)挖掘?qū)嵙?,呈現(xiàn)出的產(chǎn)品往往適得其反。通過(guò)大數(shù)據(jù)技術(shù),騰訊微博實(shí)現(xiàn)了好友關(guān)系自動(dòng)分組、低質(zhì)量信息自動(dòng)過(guò)濾、優(yōu)質(zhì)信息分類閱讀等智能化功能。
截至目前,騰訊微博注冊(cè)帳戶達(dá)到5.4億,日均活躍用戶超過(guò)8700萬(wàn),每天300G存儲(chǔ)量、1千億次服務(wù)調(diào)用、每天5萬(wàn)億次計(jì)算量。