團隊及成員介紹
團隊名稱:Fish
領隊:陳孝旭
隊員:陳孝旭
個人介紹:來自中國科學技術(shù)大學,計算機軟件理論專業(yè)2010級碩士。崇尚簡單的生活,想做一條自由自在的魚。喜歡數(shù)據(jù)挖掘,喜歡云計算,目前正積極尋找與兩者相關(guān)的工作。
作品介紹
依據(jù)對“百度知道”中用戶回答問題行為的觀察,發(fā)現(xiàn)用戶有三種渠道尋找問題并進行回答:(1)根據(jù)關(guān)鍵字搜索;(2)根據(jù)問題分類搜索;(3)隨機瀏覽。結(jié)合這個發(fā)現(xiàn),設計的算法中將對問題與用戶相關(guān)性的計算分為兩個部分,通過混合的方式判定該問題是否應該推薦給用戶。
算法描述
Algorithm
設給定用戶,以及候選n個問題 1. 計算n個問題在“問題分類”上的與用戶的相關(guān)性,并按降序排序,設得到的數(shù)值數(shù)組為為; 2. 計算n個問題在“關(guān)鍵詞”上的與用戶的相關(guān)性,并按降序排列,設得到的數(shù)值數(shù)組為; 3. 依次掃描,若數(shù)組值大于等于閾值 (為自定義參數(shù)),則將對應問題推薦給用戶;若已經(jīng)推薦了三個問題,則算法停止。若掃描結(jié)束,還缺少m個問題(0 < m <= 3),否則從選擇中前m個問題推薦給用戶。
程序框架